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数据 结构 和 数据 库 技术 是 信息 技术 的 重要 理论 技术 基础 ,不 仅 是 高 等 学 校 计算 机 科 
学 与 技术 类 专业 学 生 必修 的 两 门 专业 基础 课程 ,而 且 已 成 为 非 计算 机 专业 的 热门 选修 课 。 
目前 ,有 关 数 据 结 构 和 数据 库 技术 的 书籍 有 很 多 。 随 着 课程 建设 的 改革 、 课 时 的 缩减 ,如 
何 能 使 学 生 在 有 限 的 课时 里 更 好 地 掌握 这 两 门 课程 ,并 能 在 实际 的 软件 开发 过 程 中 自觉 
地 应 用 ,一 直 是 摆 在 广大 教师 面前 的 课题 。 本 书 结合 目前 教学 的 实际 情况 ,梳理 了 对 数据 
结构 与 数据 库 要 求 的 知识 点 ,并 形成 了 便于 学 习 和 掌握 的 相应 知识 单元 ,通过 大 量 案例 来 
解释 相关 的 原理 及 应 用 技术 ,注重 学 生 实践 能 力 的 培养 ,内 容 通 俗 易 屏 。 本 书 既 可 以 作为 
信息 管理 与 信息 系统 、 计 算 机 及 相关 专业 的 本 科教 材 ,也 可 供 自学 计算 机 基础 知识 的 读者 
参考 。 

全 书 共 15 章 , 分 为 两 大 部 分 。 前 8 章 作为 第 一 部 分 ,系统 地 介绍 了 数据 结构 的 相关 
理论 及 应 用 。 第 1 章 为 数据 结构 绪论 ,主要 介绍 数据 结构 的 相关 概念 和 术语 、 算 法 的 描述 
与 分 析 方 法 ;第 2 章 为 线性 表 , 主 要 介绍 了 顺序 表 和 链表 的 存储 表示 与 实现 ;第 3 章 为 特 
殊 线性 表 , 主 要 介绍 了 栈 . 队 列 和 串 的 存储 表示 与 实现 ;第 4 章 为 数组 ,主要 介绍 了 数组 的 
存储 表示 与 实现 ;第 5 章 为 树 与 二 叉 树 ,主要 介绍 了 二 叉 树 的 基本 知识 ,性质 , 存 储 及 遍历 
应 用 ;第 6 章 为 图 ,主要 介绍 了 图 的 基本 概念 ,存储 及 遍历 应 用 ;第 7 章 为 查找 ,主要 介绍 
了 静态 查找 动态 查找 和 哈 希 表 ; 第 8 章 为 排序 ,主要 介绍 了 直接 插入 排序 \ 希 尔 排序 、 冒 
泡 排序 ,快速 排序 .选择 排序 和 归并 排序 等 几 种 常用 的 排序 算法 及 性 能 。 第 9 一 15 章 是 第 
二 部 分 ,主要 介绍 的 是 数据 库 技术 及 其 应 用 。 第 9 章 为 数据 库 系统 概述 ,主要 介绍 了 数 
据 、 数 据 库 数据库 管理 系统 和 数据 库 系 统 等 基本 概念 ,数据 库 处 理 技术 的 发 展 ,同时 也 介 
绍 了 数据 模型 ,数据 抽象 .数据 库 模式 等 概念 ;第 10 章 为 关系 模型 与 关系 代数 ,主要 介绍 
了 关系 数据 库 实现 的 基本 理论 ,关系 的 定义 和 性 质 及 专门 的 关系 运算 方法 ;第 11 章 为 关 
系数 据 库 的 标准 语言 一 一 SQL ,包括 数据 定义 语言 .数据 控制 语言 和 数据 操纵 语言 ;第 12 
章 为 数据 库 设 计 及 优化 ,主要 介绍 了 数据 库 建 模 方法 ,包括 概念 模型 设计 过 程 、 如 何 将 概 
念 模型 转换 为 关系 模型 及 关系 模式 规范 化 理论 等 ;第 13 章 为 数据 库 安 全 性 与 完整 性 , 主 
要 包括 数据 库 安 全 性 、 完 整 性 的 基本 概念 和 措施 ,游标 ,存储 过 程 和 触发 器 的 使 用 ;第 14 
章 阐述 了 事务 管理 和 恢复 的 相关 技术 ,主要 包括 事务 的 概念 、 特 性 和 并 发 控制 ,数据 库 的 
恢复 与 备份 等 ;第 15 章 以 一 个 综合 实例 介绍 了 数据 库 应 用 系统 的 开发 过 程 。 内 容 讲解 由 
浅 入 深 , 层 次 清晰 ,通俗 易 懂 。 

本 书 具 有 以 下 特点 。 

(1) 本 书面 向 应 用 型 本 科 高 校 , 根 据 相 关 专 业 的 培养 方案 ,服务 于 应 用 型 和 技能 型 的 
高 级 实用 人 才 ,结合 该 课程 的 先行 课程 和 后 续 课程 ,组 织 相关 知识 点 与 内 容 。 本 书 结构 严 
并 ,内 容 安 排 环 环 相 扣 , 符 合 初学 者 的 学 习习 惯 。 

(2) 吸取 了 同类 教材 的 优点 ,注重 理论 和 实践 相 结合 。 在 知识 点 组 织 和 案例 设计 等 
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内 容 安排 上 , 既 着 眼 于 培养 学 生 熟 练 掌握 理论 知识 ,又 注意 锻炼 和 培养 学 生 在 程序 设计 过 
程 中 分 析 问 题 和 解决 问题 的 实践 动手 能 力 ,启发 学 生 的 创新 意识 ,使 学 生 的 理论 知识 水 平 
和 实践 技能 得 到 全 面 提升 。 

(3) 每 个 知识 点 都 包括 基础 案例 ,知识 内 容 层 层 推进 ,将 知识 点 有 机 地 串联 在 一 起 ， 
使 得 学 生 易于 接受 和 掌握 相关 知识 内 容 。 

(4) 提供 配套 的 课件 例题 和 课 后 习题 的 参考 答案 。 

本 书 由 于 秀丽 编写 。 在 本 书 的 编写 过 程 中 ,参阅 了 大 量 的 参考 书目 和 文献 资料 ,在 此 
向 参考 资料 的 作者 表示 由 圳 的 感谢 。 在 本 书 的 出 版 过 程 中 ,得 到 了 曹 妍 教授 . 陈 佳 教授 和 
王 旭 坪 教授 的 支持 和 帮助 ,还 得 到 了 清华 大 学 出 版 社 的 大 力 支持 ,在 此 表示 诚挚 的 感谢 。 
此 书 的 出 版 离 不 开 我 家 人 的 鼓励 和 照顾 ,感谢 他 们 的 默默 奉献 。 

由 于 作者 水 平 有 限 , 书 中 难免 有 不 足 和 政 漏 之 处 , 敬 请 读者 批评 指正 。 


编 者 
2018 年 2 月 
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本 章 学 习 目标 
。 热 练 掌握 数据 结构 中 涉及 的 基本 概念 。 
。 了 解数 据 结构 讨论 的 范畴 。 
。 理解 算法 的 基本 概念 描述 方法 以 及 评价 标准 。 


本 章 首 先 介 绍 数据 结构 讨论 的 范畴 ,再 介绍 数据 结构 中 涉及 的 基本 概念 和 术语 ,最 后 
介绍 算法 的 概念 .描述 方法 以 及 评价 标准 。 


1.1 数据 结构 的 概念 


1.1.1 数据 结构 的 范畴 


数据 结构 是 在 整个 计算 机 科学 与 技术 领域 上 被 广泛 使 用 的 术语 。 它 用 来 反映 一 个 数 
据 的 内 部 构成 , 即 一 个 数据 由 哪些 成 分 构成 ,以 什么 方式 构成 , 呈 什 么 结构 。 利 用 计算 机 
进行 数据 处 理 是 计算 机 应 用 的 一 个 重要 领域 。 在 进行 数据 处 理 时 ,实际 需要 处 理 的 数据 
元 素 一 般 有 很 多 ,而 这 些 数据 元 素 都 需要 存放 在 计算 机 中 ,因此 ,大 量 的 数据 元 素 在 计算 
机 中 如 何 组 织 , 以 便 提高 数据 处 理 的 效率 ,并 且 节 省 计算 机 的 存储 空间 ,是 进行 数据 处 理 
的 关键 问题 。 显 然 ,杂乱无章 的 数据 是 不 便于 处 理 的 。 而 将 大 量 的 数据 随意 地 存放 在 计 
算 机 中 ,实际 上 也 是 “ 自 找 苦 吃 ”, 对 数据 处 理 更 是 不 利 。 

计算 机 已 被 广泛 应 用 于 数据 处 理 。 数 据 处 理 , 是 指 对 数据 集合 中 的 各 元 素 以 各 种 方 
式 进行 运算 ,包括 插入 删除. 查找、 更 改 等 运算 ,也 包括 对 数据 元 素 进行 分 析 。 很 多 计算 
机 工作 者 认为 ,程序 设计 的 实质 就 是 通过 分 析 问 题 ,确定 数学 模型 和 算法 ,然后 再 选择 一 
个 好 的 数据 结构 。 即 

程序 = 算法 十 数据 结构 

计算 机 算法 与 数据 的 结构 密切 相关 ,算法 无 不 依附 于 具体 的 数据 结构 ,也 就 是 说 , 数 
据 结构 还 需要 给 出 每 种 结构 类 型 所 定义 的 各 种 运算 的 算法 。 在 数据 处 理 领 域 中 ,建立 数 
学 模型 有 时 并 不 十 分 重要 ,事实 上 ,许多 实际 问题 是 无 法 表示 成 数学 模型 的 。 人 们 最 感 兴 
趣 的 是 知道 数据 集合 中 各 数据 元 素 之 间 存 在 什么 关系 ,应 如 何 组 织 它 。 例 如 ,向 量 和 甜 阵 
就 是 数据 结构 ,在 这 两 种 数据 结构 中 ,数据 元 素 之 间 有 着 位 置 上 的 关系 。 又 如 ,图 书馆 中 
的 图 书 卡 片 目 录 , 则 是 一 个 较为 复杂 的 数据 结构 , 列 在 各 卡片 上 的 各 种 书 之 间 , 可 能 在 主 
题 , 作 者 等 问题 上 相互 关联 ,其 至 一 本 书本 身 也 有 不 同 的 相关 成 分 。 它 们 的 数学 模型 无 法 
用 数学 方程 描述 ,而 是 用 数据 结构 描述 ,解决 此 类 问题 的 关键 是 设计 出 合适 的 数据 结构 。 
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下 面 请 看 三 个 例子 。 
【 例 1.1】 学 生 入 学 登记 表 
每 年 新 生 入 学 都 会 用 类 似 如 表 1. 1 所 示 的 二 维 表 进行 信息 登记 ,以 便 完成 学 生 各 种 
数据 的 统计 。 二 维 表 ( 即 线性 表 ) 是 经 常用 到 的 数学 模型 。 
表 1.1 学 生 入 学 登记 表 


学 号 姓名 性 别 出 生日 期 专业 贷款 否 | 入 学 成 绩 备注 
2017001 | 张帆 男 1999-7-13 信息 管理 F 580 
2017002 | 郭 思 达 男 1998-6-23 信息 管理 于 563 
2017003 | 刘畅 女 1999-1-15 计算 机 F 603 
2017004 | 李晓明 男 1998-12-15 信息 管理 F 546 
2017005 | 白云 女 1999-5-25 计算 机 F 539 


【 例 1.2】 学 院 组 织 机 构 
学 院 组 织 机 构 之 间 的 数据 关系 如 图 1. 1 所 示 ,呈现 出 一 种 很 自然 的 层次 关系 ,数据 与 
数据 成 一 对 多 的 关系 ,这 就 是 我 们 所 说 的 树 状 结构 。 


管理 学 院 人 
管理 科学 与 工程 | 。 .… ”| 工商 管理 (8) (c) 
信息 管理 | [电子 商务 卫 帮 (p) (E) (:) (0) 


图 1.1 学 院 组 织 结构 图 


【 例 1.3】 交通 路 网 

从 一 个 地 方 到 另外 一 个 地 方 可 以 有 多 条 路 径 。 交 通路 网 中 的 一 个 结 点 和 另外 几 个 结 
点 都 有 联系 ,本 问题 是 一 种 典型 的 网 状 结构 问题 ,网 状 结构 是 一 种 可 以 灵活 地 描述 事物 及 
其 之 间 关 系 的 数据 模型 ,如 图 1. 2 所 示 。 

由 以 上 几 个 例子 可 见 ,描述 这 类 非 数值 计算 问题 的 
数学 模型 不 再 是 数学 方程 ,而 是 诸如 表 、 树 、 图 之 类 的 数 
据 结构 。 因 此 ,概括 地 说 : 数据 结构 课程 主要 是 研究 非 
数值 计算 的 程序 设计 问题 中 所 出 现 的 计算 机 操作 对 象 以 
及 它们 之 间 的 关系 和 操作 的 学 科 。 


图 1.2 交通 路 网 图 


1.1.2 相关 概念 和 术语 


简单 地 说 ,数据 结构 是 指 相互 有 关联 的 数据 元 素 的 集合 ,是 数据 存在 的 形式 。 数 据 结 
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构 有 逻辑 上 的 数据 结构 和 物理 上 的 数据 结构 之 分 。 人 逻辑 上 的 数据 结构 反映 数据 之 间 的 逻 
辑 关 系 ,而 物理 上 的 数据 结构 反映 数据 在 计算 机 内 部 的 存储 安排 。 在 系统 地 学 习 数 据 结 
构 知 识 之 前 ,下 面 首先 对 一 些 基 本 概念 和 术语 赋予 确切 的 含义 。 

数据 (Data) : 是 对 客观 事物 的 符号 表示 ,是 指 所 有 能 被 输入 到 计算 机 中 , 且 能 被 计算 
机 处 理 的 符号 的 集合 。 在 计算 机 科学 中 ,数据 就 是 计算 机 操作 的 对 象 的 总 称 ,是 计算 机 处 
理 信 息 的 某 种 特定 符号 的 表示 形式 ,如 图 像 .声音 等 都 可 以 通过 编码 归属 于 数据 的 范畴 。 

数据 元 素 (Data Element) : 是 数据 的 基本 单位 ,是 数据 (集合 ) 中 的 一 个 “个 体 ”。 数 
据 元 素 具 有 广泛 的 含义 。 一 般 来 说 ,现实 世界 中 客观 存在 的 一 切 个 体 都 可 以 是 数据 元 素 。 
例如 ,表示 数值 的 各 个 数 18、11、35、23、16、… 可 以 作为 数值 的 数据 元 素 ;表示 家 庭 成 员 的 
各 成 员 名 父亲 、 儿 子 、 女 儿 可 以 作为 家 庭 成 员 的 数据 元 素 。 

数据 项 (Data Item) : 是 数据 结构 中 讨论 的 最 小 单位 ,数据 元 素 可 以 是 数据 项 的 集合 。 
例如 ,描述 一 个 运动 员 的 信息 为 一 个 数据 元 素 ,而 运动 员 信息 中 的 每 一 项 (如 运动 员 编号 、 
运动 员 姓名 、 俱 乐 部 名 称 等 ) 为 一 个 数据 项 。 

关键 字 (Keyword): 是 指 能 识别 一 个 或 多 个 数据 元 素 的 数据 项 。 若 能 起 到 唯一 识别 
作用 , 则 称 之 为 主 关 键 字 (如 运动 员 编号 ) ,和 否则 称 之 为 次 关键 字 ( 如 运动 员 姓 名 ) 。 

数据 对 象 (Data Object) : 是 具有 相同 特性 的 数据 元 素 的 集合 ,如 整数 .实数 等 , 它 是 
数据 的 一 个 子 集 。 

数据 结构 (Data Structure) : 是 带 结构 的 数据 元 素 的 集合 ,或 者 说 ,数据 结构 是 相互 
之 间 存 在 着 某 种 逻辑 关系 的 数据 元 素 的 集合 。 

一 般 情况 下 ,在 具有 相同 特征 的 数据 元 素 集合 中 ,各 个 数据 元 素 之 间 存 在 有 某 种 关系 
( 即 联系 ) ,这 种 关系 反映 了 该 集合 中 的 数据 元 素 所 固有 的 一 种 结构 。 数 据 的 逻辑 结构 是 
对 数据 之 间 关 系 的 描述 , 指 反映 数 据 元 素 之 间 逻 辑 关 系 的 数据 结构 。 数 据 的 逻辑 结构 有 
两 个 要 素 : 一 是 数据 元 素 的 集合 ,通常 记 为 D; 二 是 反映 了 D 中 各 数据 元 素 之 间 的 关系 ， 
通常 记 为 尽 。 即 一 个 数据 结构 一 般 可 以 用 二 元 组 表示 成 : 

Data_Structures= (D,R) 

其 中 ,D 是 数据 元 素 的 有 限 集 ;R 是 D 上 关系 的 有 限 集 。 

数据 的 逻辑 结构 分 为 两 大 类 型 . 线性 结构 与 非 线 性 结构 。 如 果 一 个 非 空 的 数据 结构 
满足 下 列 两 个 条 件 : 

(1) 有 且 只 有 一 个 根 结 点 ; 

(2) 每 一 个 结 点 最 多 有 一 个 前 驱 , 也 最 多 有 一 个 后 继 。 
则 称 该 数据 结构 为 线性 结构 ,又 称 线性 表 。 由 此 可 以 看 出 ,在 线性 结构 中 ,各 数据 元 素 之 
间 的 前 驱 和 后 继 关 系 是 很 简单 的 ,在 一 个 线性 结构 中 插入 或 删除 任何 一 个 结 点 后 还 应 是 
线性 结构 。 如 果 一 个 数据 结构 不 是 线性 结构 , 则 称 之 为 非 线性 结构 。 显 然 ,在 非 线性 结构 
中 ,各 数据 元 素 之 间 的 前 驱 和 后 继 关系 要 比 线性 结构 复杂 。 

数据 的 逻辑 结构 可 归结 为 集合 ,线性 、 树 状 和 图 状 4 类 结构 ,如 图 1. 3 所 示 。 

(1) 集合 结构 (Set Structure) 中 的 数据 元 素 除 了 “同属 于 一 个 集合 ”的 关系 外 ,再 无 其 
他 关系 ,如 整数 集 、 字 符 集 等 。 

(2) 线性 结构 (Linear Structure) 中 的 数据 元 素 之 间 存 在 “一 对 一 ”的 关系 。 数 组 、 队 
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列 等 都 属于 线性 结构 ,如 例 1. 1 中 的 学 生 入 学 登记 表 等 。 

(3) 树 状 结构 (Tree Structure) 中 的 数据 元 素 之 间 存 在 “一 对 多 ”的 关系 ,如 例 1.2 中 
的 学 院 组 织 机 构 等 。 

(4) 图 状 结构 (Graphic Structure, 也 称 网 状 结构 ) 中 的 数据 元 素 之 间 存 在 “多 对 多 ”的 
关系 ,如 例 1. 3 中 的 交通 图 网 等 。 


9 O 0 一 0 一 0 一 0 一 0 一 人 
(a) 集合 (b) 线性 
(0) 树 状 (d) 图 状 


图 1.3 4 种 基本 数据 结构 关系 图 


在 实际 进行 数据 处 理 时 ,被 处 理 的 各 数据 元 素 总 是 被 存放 在 计算 机 的 存储 空间 中 ,并 
且 各 数据 元 素 在 计算 机 存储 空间 中 的 位 置 关系 与 它们 的 逻辑 关系 不 一 定 是 相同 的 ,而 且 
一 般 也 不 可 能 相同 。 数 据 的 逻辑 结构 在 计算 机 存储 空间 中 的 存放 形式 称 为 数据 的 存储 结 
构 ( 也 称 数 据 的 物理 结构 )。 由 于 数据 元 素 在 计算 机 存储 空间 中 的 位 置 关 系 可 能 与 逻辑 关 
系 不同 , 因 此 ,为 了 表示 存放 在 计算 机 存储 空间 中 的 各 数据 元 素 之 间 的 逻辑 关系 ,在 数据 
的 存储 结构 中 ,不 仅 要 存放 各 数据 元 素 的 信息 ,还 需要 存放 各 数据 元 素 之 间 的 关系 的 
信息 。 

一 般 来 说 ,一 种 数据 的 逻辑 结构 根据 需要 可 以 表示 成 多 种 存储 结构 ,常用 的 存储 结构 
有 顺序 .链接 .索引 等 。 而 采用 不 同 的 存储 结构 ,其 数据 处 理 的 效率 是 不 同 的 。 因 此 ,在 进 
行 数据 处 理 时 ,选择 合适 的 存储 结构 是 很 重要 的 。 

数据 的 存储 结构 不 同 决定 了 运算 不 同 。 通 常 ,一 个 数据 结构 中 的 元 素 结 点 可 能 是 在 
动态 变化 的 。 根 据 需 要 或 在 处 理 过 程 中 ,可 以 在 一 个 数据 结构 中 增加 一 个 新 结 点 ( 称 为 插 
和 运算 ) ,也 可 以 删除 数据 结构 中 的 某 个 结 点 ( 称 为 删除 运算 )。 插 和 人 与 删除 是 对 数据 结构 
的 两 种 基本 运算 。 除 此 之 外 ,对 数据 结构 的 运算 还 有 查找 、 分 类 、 合 并、 分 解 、 复 制 和 修改 
等 。 在 对 数据 结构 的 处 理 过 程 中 ,不 仅 数据 结构 中 的 结 点 ( 即 数据 元 素 ) 个 数 在 动态 地 变 
化 ,而 且 各 数据 元 素 之 间 的 关系 也 有 可 能 在 动态 地 变化 。 例 如 ,一 个 无 序 表 可 以 通过 排序 
处 理 而 变 成 有 序 表 ; 在 一 个 数据 结构 中 的 终端 结 点 后 插入 一 个 新 结 点 后 , 则 原来 的 那个 终 
端 结 点 就 不 再 是 终端 结 点 而 成 为 内 部 结 点 了 。 

数据 类 型 (Data Type) : 是 一 个 值 的 集合 和 定义 在 此 集合 上 的 一 组 操作 的 总 称 。 在 
用 高 级 程序 语言 编写 的 程序 中 ,必须 对 程序 中 出 现 的 每 个 变量 、 常 量 或 表达 式 , 明 确 说 明 
它们 所 属 的 数据 类 型 。 例 如 ,C 语言 中 提供 的 基本 数据 类 型 有 整 型 、 浮 点 型 \ 双 精度 型 . 字 
符 型 等 ,不 同类 型 的 变量 ,其 所 能 取 的 值 的 范围 不 同 ,所 能 进行 的 操作 也 不 同 。 

抽象 数据 类 型 (Abstract Data Type,ADT) : 是 指 一 个 数学 模型 以 及 定义 在 此 数学 模 


型 上 的 一 组 操作 。 本 质 上 就 是 抽象 出 数据 类 型 的 数学 特征 ,抽象 数据 类 型 可 用 三 元 组 
表示 : 

ADT =(D,R,P) 
其 中 ,D 是 数据 对 象 ;R 是 D 上 的 关系 集 ;P 是 对 DD 的 基本 操作 集 。 用 如 下 格式 定义 抽象 
数据 类 型 : 


RDT 抽象 数据 类 型 名 称 { 
数据 对 象 :< 数据 对 象 的 定义 > 
数据 关系 :< 数据 关系 的 定义 > 
基本 操作 :< 基本 操作 的 定义 > 
} RDT 抽象 数据 类 型 名 称 
其 中 ,基本 操作 的 定义 格式 为 : 


基本 操作 名 (参数 表 ) 
初始 条 件 :< 初始 条 件 描述 > 
操作 结果 :< 操作 结果 描述 > 
基本 操作 有 两 种 参数 : 赋值 参数 只 为 操作 提供 输入 值 ; 引 用 参数 以 & 开头 , 除 可 提 
供 输 入 值 外 ,还 将 返回 操作 结果 。“ 初 始 条 件 ” 描 述 了 操作 执行 之 前 数据 结构 和 参数 应 满 
足 的 条 件 , 若 不 满足 , 则 操作 失败 ,并 返回 相应 出 错 信息 。“ 操 作 结 果 ” 说 明了 操作 正常 完 
成 之 后 ,数据 结构 的 变化 状况 和 应 返回 的 结果 。 若 初始 条 件 为 空 , 则 省 略 之 。 
抽象 数据 类 型 需要 通过 固有 数据 类 型 来 实现 。 本 书 采 用 类 C 语言 进行 算法 描述 。 
类 C 语言 实际 上 是 对 C 语言 的 一 种 简化 ,保留 了 C 语言 的 精华 ,忽略 了 C 语言 语法 规则 
中 的 一 些 细节 ,这样 描述 出 的 算法 清晰 直观、 便于 阅读 和 分 析 。 有 时 也 用 伪 码 描述 一 些 
抽象 算法 。 


1.2 算法 和 算法 分 析 


1.2.1 算法 的 基本 概念 


解决 实际 问题 需要 找 出 解决 问题 的 方法 。 用 计算 机 解决 实际 问题 ,就 要 先 给 出 解决 
问题 的 算法 ,再 依据 算法 编写 程序 完成 要 求 。 算 法 (Algorithm) 是 一 组 有 穷 的 规则 ,规定 
了 解决 某 一 特定 类 型 问题 的 一 系列 运算 ,是 对 解 题 方 案 的 准确 与 完整 的 描述 。 

算法 是 解 题 的 步骤 ,可 以 把 算法 定义 成 解 一 确定 类 问题 的 任意 一 种 特殊 的 方法 。 在 
计算 机 科学 中 ,算法 要 用 计算 机 算法 语言 描述 ,算法 代表 用 计算 机 解 一 类 问题 的 精确 ,有 
效 的 方法 。 算 法 十 数据 结构 = 程序 ,求解 一 个 给 定 的 可 计算 或 可 解 的 问题 , 它 的 目标 就 是 
编制 让 计算 机 按照 人 的 想法 操作 的 指令 。 算 法 和 程序 之 间 存 在 密切 的 关系 。 算 法 是 处 理 
问题 的 策略 , 即 解 题 的 步骤 ,是 为 了 解决 某 类 问题 而 设计 的 一 个 有 限 长 的 操作 序列 。 


1. 算法 的 特征 
算法 一 般 应 具有 以 下 几 个 基本 特征 。 
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1) 确定 性 

算法 的 每 一 种 运算 必须 有 确定 的 意义 ,该 种 运算 执行 某 种 动作 应 无 二 义 性 ,目的 明 
确 , 这 一 性 质 反 映 了 算法 与 数学 公式 的 明显 差别 。 在 解决 实际 问题 时 ,可 能 会 出 现 这 样 的 
情况 : 针对 某 种 特殊 问题 ,数学 公式 是 正确 的 ,但 按 此 数学 公式 设计 的 计算 过 程 可 能 会 使 
计算 机 系统 无 所 适 从 ,这 是 因为 根据 数学 公式 设计 的 计算 过 程 只 考虑 了 正常 使 用 的 情况 ， 
而 当 出 现 异常 情况 时 ,此 计算 过 程 就 不 能 适应 了 。 

2) 可 行 性 

一 个 算法 是 可 以 被 执行 的 , 即 算法 中 的 每 个 操作 都 可 以 通过 已 经 实现 的 基本 运算 执 
行 有 限 次 来 完成 。 

3) 输入 性 

一 个 算法 有 0 个 或 多 个 输入 ,在 算法 运算 开始 之 前 给 出 算法 所 需 数据 的 初 值 , 这 些 输 
人 取 自 特定 的 对 象 集合 。 

4) 输出 性 

作为 算法 运算 的 结果 ,一 个 算法 产生 一 个 或 多 个 输出 ,输出 是 同 输入 有 某 种 特定 关系 
的 量 。 

5) 有 穷 性 

一 个 算法 总 是 在 执行 了 有 穷 步 的 运算 后 终止 , 即 该 算法 是 可 达 的 。 数 学 中 的 无 穷 级 
数 ,在 实际 计算 时 只 能 取 有 限 项 , 即 计算 无 穷 级 数值 的 过 程 只 能 是 有 穷 的 。 因 此 ,一 个 数 
的 无 穷 级 数 表示 只 是 一 个 计算 公式 ,而 根据 精度 要 求 确 定 的 计算 过 程 才 是 有 穷 的 算法 。 
算法 的 有 穷 性 还 应 包括 合理 的 执行 时 间 的 含义 。 因 为 ,如 果 一 个 算法 需要 执行 千 万 年 , 显 
然 就 失去 了 实用 价值 。 

满足 前 4 个 特征 的 一 组 规则 不 能 称 为 算法 ,只 能 称 为 计算 过 程 ,操作 系统 是 计算 过 程 
的 一 个 例子 ,在 一 个 算法 中 ,有 些 指令 可 能 是 重复 执行 的 ,因此 指令 的 执行 次 数 可 能 远 远 
大 于 算法 中 的 指令 条 数 。 由 有 穷 性 可 知 ,对 于 任何 输入 ,一 个 算法 在 执行 了 有 限 次 指令 后 
一 定 要 终止 并 且 必 须 在 有 限 的 时 间 内 完成 ,因此 ,一 个 程序 如 果 对 任何 输入 都 不 会 陷入 无 
限 循环 时 , 即 是 有 穷 的 , 则 它 就 是 一 个 算法 。 操 作 系 统 用 来 管理 计算 机 资源 ,控制 作业 的 
运行 ,没有 作业 运行 时 ,计算 过 程 并 不 停止 ,而 是 处 于 等 待 状态 。 

同时 ,在 算法 设计 时 还 应 该 考虑 从 以 下 几 个 方面 度量 算法 的 效率 。 

1) 正确 性 

正确 性 , 即 满足 预先 规定 的 功能 和 性 能 的 要 求 , 这 是 算法 设计 最 基本 的 要 求 。 算 法 应 
严格 地 按照 特定 的 规格 说 明 进 行 设计 ,要 能 够 解决 给 定 的 问题 。 但 是 ,正确 ”一 词 的 含义 
在 通常 的 用 法 中 有 很 大 的 区 别 , 大 体 上 可 分 为 以 下 4 个 层次 。 

(1) 依据 算法 所 编写 的 程序 中 不 含 语法 错误 ; 

(2) 程序 对 于 几 组 输入 数据 能 够 得 到 满足 规格 要 求 说 明 的 结果 ; 

(3) 程序 对 于 经 过 精心 挑选 较为 苛刻 的 几 组 输入 数据 也 能 够 得 到 令 人 满意 的 结果 ; 

(4) 程序 对 于 所 有 符合 要 求 的 输入 数据 都 能 得 到 正确 的 输出 。 

对 于 大 型 软件 需要 进行 专业 测试 ,一 般 情况 下 ,通常 以 第 (3) 个 要 求 作为 衡量 算法 正 
确 性 的 标准 。 
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2) 可 读 性 

可 读 性 是 指 一 个 算法 应 当 思 路 清晰 、 层 次 分 明 、 简 单 明 了 、 易 读 易 懂 。 设 计算 法 的 主 
要 目的 是 解决 实际 问题 ,在 设计 实现 一 个 项 目 时 ,往往 不 是 一 个 人 独立 完成 的 。 为 了 达到 
可 读 性 的 要 求 , 在 设计 算法 时 ,一 般 要 使 用 有 一 定 意义 的 标识 符 来 命名 变量 函数 等 ,以 便 
于 “ 见 名 知 意 ”。 其 次 ,可 以 在 算法 的 开头 或 指令 的 后 面 加 注释 来 解释 算法 和 指令 的 功能 。 

3) 健壮 性 

健壮 性 是 指 一 个 算法 应 该 具有 很 强 的 容错 能 力 , 当 输入 不 合法 的 数据 时 ,算法 应 当 能 
做 适当 的 处 理 ,使 得 不 至 于 引起 严重 的 后 果 。 当 输入 不 合法 的 数据 时 ,算法 能 做 出 相应 的 
响应 或 进行 适当 的 处 理 , 避 免 带 着 非法 数据 执行 ,导致 莫名 其 妙 的 结果 。 

4) 效率 与 存储 量 需 求 

运行 时 间 是 指 算法 在 计算 机 上 运行 所 花费 的 时 间 , 它 等 于 算法 中 每 条 语句 执行 时 间 
的 总 和 。 一 般 来 说 ,执行 时 间 越 短 ,性 能 越 好 。 依 据 算法 编写 的 程序 运行 速度 较 快 。 

占用 空间 是 指 算法 在 计算 机 上 存储 所 占用 的 存储 空间 ,包括 存储 算法 本 身 所 占用 的 
存储 空间 、 算 法 的 输入 及 输出 数据 所 占用 的 存储 空间 和 算法 在 运行 过 程 中 临时 占用 的 存 
储 空间 。 依 据 算 法 编写 的 程序 在 运行 时 所 需 内 存 空 间 较 小 。 

对 于 一 个 系统 设计 人 员 来 说 ,前 三 项 很 容易 实现 。 在 使 用 软件 时 ,人 们 更 加 注重 于 软 
件 的 运行 速度 ,而 最 后 一 项 恰恰 是 影响 速度 的 主要 因素 。 


2. 算法 描述 


算法 的 描述 方法 可 以 归纳 为 以 下 几 种 。 

(1) 自然 语言 。 

(2) 图 形 , 如 N-S 图 流程 图 ,图 的 描述 与 算法 语言 的 描述 对 应 。 

(3) 算法 语言 , 即 计算 机 语言 .程序 设计 语言 , 伪 代 码 。 

(4) 形式 语言 。 用 数学 的 方法 ,可 以 避免 自然 语言 的 二 义 性 。 

用 各 种 算法 描述 方法 所 描述 的 同一 算法 ,其 功用 是 一 样 的 ,允许 在 算法 的 描述 和 实现 
方法 上 有 所 不 同 。 

人 们 的 生产 活动 和 日 常生 活 离 不 开 算 法 ,都 在 自觉 不 自觉 地 使 用 算法 ,例如 ,人 们 要 
购买 物品 ,会 首先 确定 购买 哪些 物品 ,准备 好 所 需 的 钱 ,然后 确定 到 哪些 商场 选 购 .怎样 去 
商场 .行走 的 路 线 , 若 物品 的 质量 好 如 何 处 理 ,对 物品 不 满意 又 怎样 处 理 , 购 买 物品 后 做 什 
么 等 。 以 上 购物 算法 是 用 自然 语言 描述 的 ,也 可 以 用 其 他 描述 方法 描述 该 算法 。 


3. 算法 设计 基本 方法 


计算 机 解 题 的 过 程 实际 上 是 在 实施 某 种 算法 ,这 些 算法 可 称 为 计算 机 算法 。 计 算 机 
算法 不 同 于 人 工 处 理 的 方法 。 在 实际 应 用 时 ,各 种 方法 之 间 往 往 存 在 着 一 定 的 联系 。 

1) 列举 法 

列举 法 的 基本 思想 是 根据 提出 的 问题 ,列举 所 有 可 能 的 情况 ,并 用 问题 中 给 定 的 条 件 
检验 哪些 是 需要 的 ,哪些 是 不 需要 的 。 因 此 ,列举 法 常用 于 解决 是否 存 在 ”或 “有 多 少 种 
可 能 ”等 类 型 的 问题 ,例如 求解 不 定 方程 的 问题 。 列 举 法 的 特点 是 算法 比较 简单 ,但 当 列 
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举 的 可 能 情况 较 多 时 ,执行 列举 算法 的 工作 量 将 会 很 大 。 因 此 ,在 用 列举 法 设计 算法 时 ， 
使 方案 优化 ,尽量 减少 运算 工作 量 ,是 应 该 重点 注意 的 。 通 常 ,在 设计 列举 算法 时 ,只 要 对 
实际 问题 进行 详细 的 分 析 ,将 与 问题 有 关 的 知识 条 理化 完备 化 .系统 化 ,从 中 找 出 规律 ; 
或 对 所 有 可 能 的 情况 进行 分 类 ,引出 一 些 有 用 的 信息 ,是 可 以 大 大 减少 列举 量 的 。 

列举 原理 是 计算 机 应 用 领域 中 十 分 重要 的 原理 。 许 多 实际 问题 , 若 采用 人 工 列举 是 
不 可 想象 的 ,但 由 于 计算 机 的 运算 速度 快 ,擅长 重复 操作 ,可 以 很 方便 地 进行 大 量 列举 。 
列举 算法 虽然 是 一 种 比较 笨拙 而 原始 的 方法 ,其 运算 量 比较 大 ,但 在 有 些 实际 问题 中 (如 
寻找 路 径 、 查 找 、 搜 索 等 问题 ), 局 部 使 用 列举 法 却 是 很 有 效 的 ,因此 ,列举 算法 是 计算 机 算 
法 中 的 一 个 基础 算法 。 

2) 归纳 法 

归纳 法 的 基本 思想 是 ,通过 列举 少量 的 特殊 情况 ,经 过 分 析 , 最 后 找 出 一 般 的 关系 。 
显然 ,归纳 法 要 比 列举 法 更 能 反映 问题 的 本 质 , 并 且 可 以 解决 列举 量 为 无 限 的 问题 。 但 
是 ,从 一 个 实际 问题 中 总 结 归 纳 出 一 般 的 关系 ,并 不 是 一 件 容 易 的 事情 ,尤其 是 要 归纳 出 
一 个 数学 模型 更 为 困难 。 从 本 质 上 讲 , 归 纳 就 是 通过 观察 一 些 简单 而 特殊 的 情况 ,最 后 总 
结 出 一 般 性 的 结论 。 

归纳 是 一 种 抽象 , 即 从 特殊 现象 中 找 出 一 般 关系 。 但 由 于 在 归纳 的 过 程 中 不 可 能 对 
所 有 的 情况 进行 列举 ,因此 ,最 后 由 归纳 得 到 的 结论 还 只 是 一 种 猜测 ,还 需要 对 这 种 猜测 
加 以 必要 的 证 明 。 实 际 上 ,通过 精心 观察 而 得 到 的 猜测 得 不 到 证 实 或 最 后 证 明 猜 测 是 错 
的 ,也 是 常 有 的 事 。 

3) 递 推 法 

所 谓 递 推 , 是 指 从 已 知 的 初始 条 件 出 发 ,逐次 推出 所 要 求 的 各 中 间 结 果 和 最 后 结果 。 
其 中 ,初始 条 件 或 是 问题 本 身 已 经 给 定 ,或 是 通过 对 问题 的 分 析 与 化 简 而 确定 。 递 推 本 质 
上 也 属于 归纳 法 ,工程 上 许多 递 推 关 系 式 实际 上 是 通过 对 实际 问题 的 分 析 与 归纳 而 得 到 
的 ,因此 , 递 推 关系 式 往往 是 归纳 的 结果 。 递 推算 法 在 数值 计算 中 是 极为 常见 的 。 但 是 ， 
对 于 数值 型 的 递 推算 法 ,必须 要 注意 数值 计算 的 稳定 性 问题 。 

4) 递归 法 

在 解决 一 些 复杂 问题 时 ,为 了 降低 问题 的 复杂 程度 (如 问题 的 规模 等 ) ,一 般 总 是 将 问 
题 逐 层 分 解 , 最 后 归结 为 一 些 最 简单 的 问题 。 这 种 将 问题 逐 层 分 解 的 过 程 , 实 际 上 并 没有 
对 问题 进行 求解 ,而 只 是 当 解 决 了 最 后 那些 最 简单 的 问题 后 ,再 沿 着 原来 分 解 的 逆 过 程 逐 
步 进行 综合 ,这 就 是 递归 的 基本 思想 。 由 此 可 以 看 出 ,递归 的 基础 也 是 归纳 。 在 实际 工程 
中 ,有 许多 问题 就 是 用 递归 来 定义 的 ,数学 中 的 许多 函数 也 是 用 递归 来 定义 的 。 递 归 在 可 
计算 性 理论 和 算法 设计 中 占有 很 重要 的 地 位 。 

递归 分 为 直接 递归 与 间接 递归 两 种 。 如 果 一 个 算法 PP 显 式 地 调用 自己 则 称 为 直接 
递归 。 如 果 算 法 已 调用 另 一 个 算法 Q ,而 算法 Q 又 调用 算法 尸 , 则 称 为 间接 递归 。 递 归 
是 很 重要 的 算法 设计 方法 之 一 。 实 际 上 ,递归 过 程 能 将 一 个 复杂 的 问题 归结 为 若干 个 较 
简单 的 问题 ,然后 将 这 些 较 简单 的 问题 再 归结 为 更 简单 的 问题 ,这 个 过 程 可 以 一 直 做 下 
去 ,直到 最 简单 的 问题 为 止 。 

有 些 实际 问题 , 既 可 以 归纳 为 递 推算 法 ,又 可 以 归纳 为 递归 算法 。 但 递 推 与 递归 的 实 
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现 方法 是 大 不 一 样 的 。 递 推 是 从 初始 条 件 出 发 ,逐次 推出 所 需求 的 结果 ;而 递归 则 是 从 算 
法 本 身 到 达 递 归 边 界 的 。 通 常 ,递归 算法 要 比 递 推算 法 清晰 易 读 ,其 结构 比较 简练 。 特 别 
是 在 许多 比较 复杂 的 问题 中 ,很 难 找 到 从 初始 条 件 推出 所 需 结果 的 全 过 程 ,此 时 ,设计 递 
归 算 法 要 比 递 推 算法 容易 得 多 。 但 递归 算法 的 执行 效率 比较 低 。 

5) 减 半 递 推 技术 

实际 问题 的 复杂 程度 往往 与 问题 的 规模 有 着 密切 的 联系 。 因 此 ,利用 分 治 法 解决 这 
类 实际 问题 是 有 效 的 。 所 谓 分 治 法 ,就 是 对 问题 分 而 治之 。 工 程 上 常用 的 分 治 法 是 减 半 
递 推 技术 。“ 减 半 ”, 是 指 将 问题 的 规模 减 半 , 而 问题 的 性 质 不 变 ;“ 递 推 ”, 是 指 重复 “ 减 半 ” 
的 过 程 。 

6) 回溯 法 

前 面 讨论 的 递 推 和 递归 算法 本 质 上 是 对 实际 问题 进行 归纳 的 结果 ,而 减 半 递 推 技术 
也 是 归纳 法 的 一 个 分 支 。 在 工程 上 ,有 些 实际 问题 很 难 归纳 出 一 组 简单 的 递 推 公式 或 直 
观 的 求解 步骤 ,并 且 也 不 能 进行 无 限 的 列举 。 对 于 这 类 问题 ,一 种 有 效 的 方法 是 “ 试 ”。 通 
过 对 问题 的 分 析 , 找 出 一 个 解决 问题 的 线索 ,然后 沿 着 这 个 线索 逐步 试探 ,对 于 每 一 步 的 
试探 ,车 试探 成 功 ,就 得 到 问题 的 解 , 若 试探 失败 ,就 逐步 回 退 , 换 别 的 路 线 再 进行 试探 。 
这 种 方法 称 为 回溯 法 。 回 溯 法 在 处 理 复杂 数据 结构 方面 有 着 广泛 的 应 用 。 


1.2.2 算法 复杂 度 


同一 个 问题 可 用 不 同 算法 解决 ,一 个 算法 的 优 劣 将 影响 到 算法 乃至 程序 的 效率 。 算 
法 分 析 中 最 关心 的 就 是 算法 所 需要 的 时 间 消 耗 和 空间 占用 量 , 即 算法 的 时 间 复 杂 度 和 空 
间 复杂 度 。 


1. 时 间 复 杂 度 


为 了 能 够 比较 客观 地 反映 出 一 个 算法 的 效率 ,在 度量 一 个 算法 的 工作 量 时 ,不 仅 应 该 
与 所 使 用 的 计算 机 ,程序 设计 语言 以 及 程序 编制 者 无 关 , 还 应 该 与 算法 实现 过 程 中 的 许多 
细节 无 关 。 为 此 ,可 以 用 算法 在 执行 过 程 中 所 需 基本 运算 的 执行 次 数 来 度量 算法 的 工作 
量 。 基 本 运算 反映 了 算法 运算 的 主要 特征 ,因此 ,用 基本 运算 的 次 数 来 度量 算法 工作 量 是 
客观 的 ,也 是 实际 可 行 的 ,有 利于 比较 同一 问题 的 几 种 算法 的 优 劣 。 例 如 ,在 考虑 两 个 矩 
阵 相 乘 时 ,可 以 将 两 个 实数 之 间 的 乘法 运算 作为 基本 运算 ,而 对 于 所 用 的 加 法 (或 减法 ) 运 
算 忽 略 不 计 。 又 如 , 当 需 要 在 一 个 表 中 进行 查找 时 ,可 以 将 两 个 元 素 之 间 的 比较 作为 基本 
运算 。 

算法 所 执行 的 基本 运算 次 数 还 与 问题 的 规模 有 关 。 例 如 ,两 个 20 阶 和 矩阵 相 乘 与 两 个 
10 阶 矩 阵 相 乘 ,所 需要 的 基本 运算 ( 即 两 个 实数 的 乘法 ) 次 数 显 然 是 不 同 的 ,前 者 需要 更 
多 的 运算 次 数 。 因 此 ,在 分 析 算 法 的 工作 量 时 ,还 必须 对 问题 的 规模 进行 度量 。 

综 上 所 述 ,算法 的 工作 量 用 算法 所 执行 的 基本 运算 次 数 来 度量 ,而 算法 所 执行 的 基本 
运算 次 数 是 问题 规模 的 函数 , 即 

算法 的 工作 量 ==f(n) 
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其 中 ,n 是 问题 的 规模 。 

一 个 特定 算法 的 “算法 运行 时 间 1” 的 大 小 ,只 依赖 于 问题 的 规模 (通常 用 整数 量 n 表 
示 ) ,或 者 说 , 它 是 问题 规模 的 函数 , 即 T(z)。 假 如 随 着 问题 规模 ”的 增长 ,算法 执行 时 
间 的 增长 趋势 和 规模 函数 f(n) 的 增长 趋势 相同 , 则 可 记 作 : 

T(n)=O(f(n)) 
称 T(n) 为 算法 的 时 间 复杂 度 。 

算法 = 控制 结构 十 基本 操作 的 原 操作 。 算 法 的 执行 时 间 与 原 操作 总 的 执行 次 数 成 正 
比 , 因 此 ,我 们 只 是 将 算法 中 基本 操作 重复 执行 的 次 数 作为 算法 执行 时 间 的 量度 。 

要 估计 算法 的 时 间 复 杂 度 ,需要 完成 以 下 两 步 。 

(1) 从 算法 中 找 基 本 操作 的 原 操作 ; 

(2) 计算 原 操作 重复 执行 的 次 数 的 量 级 。 

时 间 复 杂 度 往往 不 是 精确 的 执行 次 数 ,而 是 估算 的 数量 级 , 它 着 重 体现 的 是 随 着 问题 
规模 2 的 增 大 ,算法 执行 时 间 的 变化 趋势 。 例 如 ,两 个 ” 阶 和 矩阵 相 乘 所 需要 的 基本 运算 
( 即 两 个 实数 的 乘法 ) 次 数 为 , 即 计算 工作 量 为 w ,也 就 是 时 间 复 杂 度 为 ni 。 

在 具体 分 析 一 个 算法 的 工作 量 时 ,还 会 存在 这 样 的 问题 : 对 于 一 个 固定 的 规模 ,算法 
所 执行 的 基本 运算 次 数 还 可 能 与 特定 的 输入 有 关 , 而 实际 上 又 不 可 能 将 所 有 可 能 情况 下 
算法 所 执行 的 基本 运算 次 数 都 列举 出 来 。 例 如 ,在 长 度 为 的 一 维 数组 中 查找 值 为 x 的 
元 素 ,车 采用 顺序 搜索 法 , 即 从 数组 的 第 一 个 元 素 开始 ,逐个 与 被 查 值 x 进行 比较 。 显 
然 ,如果 第 一 个 元 素 恰 为 zx, 则 只 需要 比较 1 次 ;但 如 果 x 为 数组 的 最 后 一 个 元 素 , 或 者 x 
不 在 数组 中 , 则 需要 比较 次 才能 得 到 结果 。 因 此 ,在 这 个 问题 的 算法 中 ,其 基本 运算 ( 即 
比较 ) 的 次 数 与 具体 的 被 查 值 x 有 关 。 

例如 ,下 面 列举 几 个 程序 段 ,说 明 如 何 求 算法 的 时 间 复 杂 度 。 


(1) x=x+1; 

(2)for (i=1; i<=n; i++) x=x+1; 

(3) for (i=1;i<=n;i++) 

for (j=1;j<=n;j++) x=x+1; 

包含 基本 操作 “zx 增 1” 的 语句 的 频 度 分 别 为 1、n 和 n?, 因 此 这 三 个 程序 段 的 时 间 复 
杂 度 分 别 如 下 。 

(1) 该 程序 段 的 执行 时 间 是 一 个 与 问题 规模 无 关 的 常数 ,因此 ,算法 的 时 间 复杂 度 
为 常数 阶 , 记 作 T(n) 二 0(1)。 事 实 上 ,只 要 算法 的 执行 时 间 不 随 着 问题 规模 的 增加 而 
增加 ,即使 算法 中 有 上 千 条 语句 ,其 执行 时 间 也 不 过 是 一 个 较 大 的 常数 ,此 时 ,算法 的 时 间 
复杂 度 也 只 是 0(1)。 

(2) 要 确定 某 个 算法 的 阶 次 ,需要 确定 某 个 特定 语句 或 某 个 语句 集运 行 的 次 数 。 第 
二 个 程序 段 中 ,因为 循环 体 中 的 代码 需要 执行 2 次 , 它 循环 的 时 间 复 杂 度 为 0(n) ,算法 的 
时 间 复 杂 度 为 线性 阶 , 记 作 T(n) 二 O(n)。 

(3) 对 循环 语句 只 考虑 循环 体 中 语句 的 执行 次 数 。 因 此 ,第 三 个 程序 段 中 执行 次 数 
为 Fo) 二 天, 所 以 该 程序 段 的 时 间 复 杂 度 为 T(z) 二 OG? ) ,被 称 为 平方 阶 。 由 此 可 见 , 当 
有 若干 个 循环 语句 时 ,算法 的 时 间 复 杂 度 是 由 赃 套 层 数 最 多 的 循环 语句 中 最 内 层 语句 的 


12 


执行 次 数 f(x) 决 定 的 。 时 间 复 杂 度 只 需要 取 最 高 项 ,并 忽略 常数 系数 。 
2. 空间 复杂 度 


一 个 算法 的 空间 复杂 度 , 一 般 是 指 执 行 这 个 算法 所 需要 的 内 存 空 间 。 
类 似 于 算法 的 时 间 复 杂 度 ,算法 的 空间 复杂 度 定义 为 : 
S(n=0O0(g(n)) 
表示 随 着 问题 规模 的 增 大 ,算法 运行 所 需 存储 量 的 增长 率 与 g(z) 的 增长 率 相同 。 

一 个 算法 所 占用 的 存储 空间 包括 算法 程序 所 占 的 空间 、 输 入 的 初始 数据 所 占 的 存储 
空间 ,以 及 算法 执行 过 程 中 所 需要 的 额外 空间 。 其 中 ,额外 空间 包括 算法 程序 执行 过 程 中 
的 工作 单元 以 及 某 种 数据 结构 所 需要 的 附加 存储 空间 。 在 许多 实际 问题 中 ,为 了 减少 算 
法 所 占 的 存储 空间 ,通常 采用 压缩 存储 技术 ,以 便 尽量 减少 不 必要 的 额外 空间 。 


小 结 


本 章 从 数据 这 个 最 基本 的 概念 人手 ,引出 了 数据 结构 的 相关 概念 ,论述 了 数据 结构 讨 
论 的 范畴 ,并 说 明了 算法 的 基本 概念 .描述 方法 以 及 评价 标准 。 

数据 结构 是 计算 机 存储 组织 数据 的 方式 。 数 据 结构 是 指 相互 之 间 存 在 一 种 或 多 种 
特定 关系 的 数据 元 素 的 集合 。 一 个 数据 结构 是 由 数据 元 素 依 据 某 种 逻辑 关系 组 织 起 来 
的 。 对 数据 元 素 间 逻 辑 关 系 的 描述 称 为 数据 的 逻辑 结构 。 数 据 必 须 在 计算 机 内 存储 , 数 
据 的 存储 结构 是 数据 结构 的 实现 形式 ,是 其 在 计算 机 内 的 存储 。 此 外 ,讨论 一 个 数据 结构 
时 必须 同时 讨论 在 该 类 数据 结构 上 执行 的 运算 才 有 意义 。 一 个 数据 逻辑 结构 可 以 有 多 种 
存储 结构 , 且 各 种 存储 结构 会 影响 数据 处 理 的 效率 。 通 常情 况 下 ,精心 选择 的 数据 结构 可 
以 带 来 更 高 的 运行 效率 或 者 存储 效率 。 

(1) 数据 结构 指 的 是 数据 之 间 的 相互 关系 , 即 数据 的 组 织 形式 。 

(2) 数据 元 素 是 数据 的 基本 单位 。 在 不 同 的 条 件 下 ,数据 元 素 又 可 称 为 元 素 、 结 点 、 
顶点 .记录 等 。 

(3) 数据 对 象 是 性 质 相 同 的 数据 元 素 的 集合 ,是 数据 的 一 个 子 集 。 

(4) 数据 结构 的 4 种 基本 结构 是 集合 结构 线性 结构 . 树 状 结构 、 图 状 结构 。 

(5) 数据 结构 的 形式 定义 为 Data_Structures 二 (D,R), 其 中 ,D 是 数据 元 素 的 有 限 
集 ,R 是 D 上 关系 的 有 限 集 。 

(6) 抽象 数据 类 型 是 指 一 个 数学 模型 以 及 定义 在 此 数学 模型 上 的 一 组 操作 。 抽 象 数 
据 类 型 可 以 帮助 我 们 更 容易 地 描述 现实 世界 。 

(7) 算法 是 对 特定 问题 求解 步骤 的 一 种 描述 ,是 指令 的 有 限 序列 。 

(8) 一 个 算法 应 该 具有 5 个 特征 : 有 穷 性 ,确定 性 ,可 行 性 ,有 输入 ,有 输出 。 

(9) 算法 通过 时 间 复 杂 度 和 空间 复杂 度 进行 度量 ,应 该 逐步 掌握 其 基本 分 析 方 法 。 

(10) 算法 的 时 间 复 杂 度 是 指 运行 算法 时 所 需要 消耗 的 时 间 ,一 般 只 要 大 致 计算 出 相 
应 的 数量 级 即 可 。 

(11) 算法 的 空间 复杂 度 是 指 算法 在 计算 机 内 执行 时 所 需 存储 空间 的 度量 。 
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(12) 一 个 算法 的 时 间 和 空间 复杂 度 越 好 , 则 算法 的 效率 就 越 高 。 
习题 


1.1 简 述 下 列 术语 : 数据 ,数据 元 素 ,数据 对 象 ,数据 结构 ,逻辑 结构 ,物理 结构 ,时 
间 复杂 度 。 

1.2 何谓 算法 ? 试 叙述 算法 的 特征 及 算法 必须 满足 的 条 件 。 

1.3 写 出 下 面 程序 段 的 时 间 复 杂 度 。 


(= 
while (i<=n-1) { 
i++? 
k+=10¥ i;} 


(2) for (i=1;i<=n;i++) 
if (3* i<=n) 
for(j=3* i;j<=n;j++) 


{ x=x+1; y=3* x+2;} 


本 章 学 习 目标 
。 熟练 掌握 线性 表 的 定义 及 其 特点 。 
。 理解 线性 表 的 顺序 存储 结构 。 
。 理解 线性 表 的 链 式 存储 结构 。 


本 章 介绍 线性 表 的 定义 ,线性 表 的 两 种 存储 结构 : 顺序 存储 和 链 式 存 储 , 以 及 实现 在 
线性 表 的 抽象 数据 类 型 中 定义 的 所 有 操作 。 


2.1 线性 表 的 逻辑 结构 


2.1.1 线性 表 的 定义 


线性 表 (Line List) 是 最 简单 .最 常用 的 一 种 数据 结构 。 

线性 表 由 一 组 数据 元 素 构成 。 数 据 元 素 的 含义 很 广泛 ,在 不 同 的 具体 情况 下 , 它 可 
以 有 不 同 的 含义 。 例 如 ,英文 小 写字 母 表 (a,b,c,…',z) 是 一 个 长 度 为 26 的 线性 表 , 其 
中 的 每 一 个 小 写字 母 就 是 一 个 数据 元 素 。 再 如 ,一 年 中 的 4 个 季节 ( 春 、 夏 . 秋 、 冬 ) 是 
一 个 长 度 为 4 的 线性 表 , 其 中 的 每 一 个 季节 名 就 是 一 个 数据 元 素 。 和 矩阵 也 是 一 个 线性 
表 , 只 不 过 它 是 一 个 比较 复杂 的 线性 表 。 在 矩阵 中 , 既 可 以 把 每 一 行 看 成 是 一 个 数据 
元 素 ( 即 一 个 行 向 量 为 一 个 数据 元 素 ) ,也 可 以 把 每 一 列 看 成 是 一 个 数据 元 素 ( 即 一 个 
列 向 量 为 一 个 数据 元 素 )。 其 中 ,每 一 个 数据 元 素 ( 一 个 行 向 量 或 一 个 列 向 量 ) 实 际 上 
又 是 一 个 简单 的 线性 表 。 数 据 元 素 可 以 是 简单 项 ,如 上 述 例子 中 的 字母 .季节 名 等 ;在 
稍微 复杂 的 线性 表 中 ,一 个 数据 元 素 还 可 以 由 若干 个 数据 项 组 成 。 例 如 , 某 班 的 学 生 
情况 登记 表 是 一 个 复杂 的 线性 表 , 表 中 每 一 个 学 生 的 情况 就 组 成 了 线性 表 中 的 每 一 个 
元 素 ,每 一 个 数据 元 素 包 括 姓名 ,学 号 .性别 .年龄 和 成 绩 数据 项 ,在 这 种 复杂 的 线性 表 
中 ,由 若干 数据 项 构成 的 数据 元 素 称 为 记录 (Record) ,而 由 多 个 记录 构成 的 线性 表 又 称 
为 文件 (File) 。 

显然 ,线性 表 是 一 种 线性 结构 。 线 性 结构 的 特点 是 数据 元 素 之 间 是 一 种 线性 关系 , 即 
数据 元 素 “ 一 个 接 一 个 地 排列 ”。 数 据 元 素 在 线性 表 中 的 位 置 只 取决 于 它们 自己 的 序号 ， 
即 数据 元 素 之 间 的 相对 位 置 是 线性 的 。 

综 上 所 述 ,线性 表 是 具有 相同 数据 类 型 的 zx(z 之 0) 个 数据 元 素 的 有 限 序列 , 记 为 : 

(ai yaz，%… Qi19GiyGiH1 和 Cn) 


其 中 ,n 为 线性 表 的 表 长 , 当 n==0 时 的 线性 表 称 为 空 表 ;ai;(i 一 1,2,…,n) 是 属于 数据 对 象 
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的 元 素 , 通 常 也 称 其 为 线性 表 中 的 一 个 结 点 ;i 为 数据 元 素 线性 表 中 的 位 序 。 


线性 表 的 基本 特征 为 : 集合 中 必 存 在 唯一 的 一 个 “第 一 元 素 ”; 四 集合 中 必 存 在 唯 


一 的 一 个 “最 后 元 素 ”; @ 除 最 后 元 素 外 , 均 有 唯一 的 后 继 ; 四 除 第 一 元 素 外 , 均 有 唯一 的 
前 驱 。 


2.1.2 线性 表 的 基本 操作 


抽象 数据 类 型 线性 表 的 定义 如 下 。 


ADT List { 
数据 对 象 :D={ ai| a EElemset, i=1,2,*…,n,n 之 0 } 
数据 关系 :R={ <aiivai>laiivaiEDri2 必 pv} 
基本 操作 :P= {结构 初始 化 操作 ,销毁 线性 表 操 作 ,… } 

} ADT List 


线性 表 上 的 基本 操作 有 以 下 几 种 。 

(1) 初始 化 操作 : InitList(&L)。 

初始 条 件 : 线性 表 革 不 存在 。 

操作 结果 : 构造 一 个 新 的 线性 表 。 

(2) 销毁 操作 : DestroyList(&L) 。 

初始 条 件 : 线性 表 虐 已 存在 。 

操作 结果 : 销毁 线性 表 工 。 

(3) 定位 操作 : LocateElem(L, e, compare( ) ) 。 

初始 条 件 : 线性 表 工 已 存在 ,e 为 给 定 值 ,compare( ) 是 元 素 判 定 函数 。 

操作 结果 : 返回 工 中 第 一 个 与 e 满足 关系 compare( ) 的 元 素 的 位 序 。 若 这 样 的 元 素 


不 存在 , 则 返回 值 为 0。 


(4) 求 线性 表 的 长 度 : ListLength(L)。 

初始 条 件 : 线性 表 工 存在 。 

操作 结果 : 返回 线性 表 中 所 含 元 素 的 个 数 。 

(5) 插入 数据 元 素 操 作 : ListInsert(&L, i, e)。 

初始 条 件 : 线性 表 工 已 存在 ,有 1<i<ListLength (L) 十 1。 

操作 结果 : 在 工 的 第 i 个 元 素 之 前 插入 新 的 元 素 e,L 的 长 度 增 1。 

(6) 删除 数据 元 素 操 作 : ListDelete(&L, i, &e)。 

初始 条 件 : 线性 表 工 已 存在 , 且 1<i<ListLength (L)。 

操作 结果 : 删除 工 的 第 i 个 元 素 , 并 用 。 返 回 其 值 ,L 的 长 度 减 1。 

需要 说 明 的 是 , 某 数 据 结 构 上 的 基本 运算 ,并 不 是 它 的 全 部 运算 ,而 是 一 些 常 用 的 基 


本 的 运算 。 各 操作 定义 的 线性 表 工 仅仅 是 一 个 抽象 在 逻辑 结构 层次 的 线性 表 ,尚未 涉及 
它 的 存储 结构 ,而 算法 只 有 在 存储 结构 确立 之 后 才能 实现 。 


2.2 线性 表 的 顺序 存储 及 运算 实现 


2.2.1 顺序 存储 的 特点 


在 计算 机 中 存放 线性 表 , 一 种 最 简单 的 方法 是 顺序 存储 ,也 称 为 顺序 分 配 。 线 性 表 的 
顺序 存储 结构 具有 以 下 两 个 基本 特点 。 

(1) 线性 表 中 所 有 元 素 所 占 的 存储 空间 是 连续 的 ; 

(2) 线性 表 中 各 数据 元 素 在 存储 空间 中 是 按 逻 辑 顺 序 依次 存放 的 。 

由 此 可 以 看 出 ,在 线性 表 的 顺序 存储 结构 中 ,前 后 两 个 元 素 在 存储 空间 中 是 紧邻 的 ， 
某 元 素 一 定 存储 在 后 继 元 素 的 前 面 。 

在 线性 表 的 顺序 存储 结构 中 ,如 果 线 性 表 中 各 数据 元 素 所 占 的 存储 空间 ( 字 节 数 ) 相 
等 , 则 在 线性 表 中 查找 某 一 个 元 素 是 很 方便 的 。 

假设 线性 表 中 的 第 一 个 数据 元 素 的 存储 地 址 ( 指 第 一 个 字 节 的 地 址 , 即 首 地 址 ) 为 0， 
每 个 数据 元 素 占 个 存储 单元 , 则 线性 表 中 第 i 个 元 


素 a; 在 计算 机 存储 空间 中 的 存储 地 址 为 LOC(a; ) = 中 4 近 
5 十 (i 一 1) Xk, 即 在 顺序 存储 结构 中 ,线性 表 中 每 一 个 b+1 和 


数据 元 素 在 计算 机 存储 空间 中 的 存储 地 址 由 该 元 素 在 
线性 表 中 的 位 置 序号 唯一 确定 。 因 此 ,只 要 知道 线性 
表 的 起 始 地 址 ,线性 表 中 任 一 数据 元 素 都 可 以 随机 存 b+(i-Dk a 
取 。 一般 来 说 ,长 度 为 n 的 线性 表 在 计算 机 中 的 顺序 
存储 结构 如 图 2. 1 所 示 。 

在 程序 设计 语言 中 ,通常 定义 一 个 一 维 数组 来 表 
示 线 性 表 的 顺序 存储 空间 。 因 为 程序 设计 语言 中 的 一 
维 数组 与 计算 机 中 实际 的 存储 空间 结构 是 类 似 的 ,这 
就 便于 用 程序 设计 语言 对 线性 表 进 行 各 种 运算 处 理 。 
在 用 一 维 数组 存放 线性 表 时 ,该 一 维 数组 的 长 度 通 常 ”图 2.1 线性 表 顺序 存储 示意 图 
要 定义 得 比 线性 表 的 实际 长 度 大 一 些 , 以 便 对 线性 表 
进行 各 种 运算 ,特别 是 插入 运算 。 在 一 般 情况 下 ,如 果 线 性 表 的 长 度 在 处 理 过 程 中 是 动态 
变化 的 , 则 在 开辟 线性 表 的 存储 空间 时 要 考虑 到 线性 表 在 动态 变化 过 程 中 可 能 达到 的 最 
大 长 度 。 如 果 开 始 时 所 开辟 的 存储 空间 太 小 , 则 在 线性 表 动 态 增长 时 可 能 会 出 现存 储 空 
间 不 够 而 无 法 再 插入 新 的 元 素 ; 但 如 果 开 始 时 所 开辟 的 存储 空间 太 大 ,而 实际 上 又 用 不 着 
那么 大 的 存储 空间 , 则 会 造成 存储 空间 的 浪费 。 在 实际 应 用 中 ,可 以 根据 线性 表 动 态 变化 
过 程 中 的 一 般 规模 来 决定 开辟 的 存储 空间 量 。 


b+(n-l)k a 


2.2.2 顺序 表 上 的 运算 实现 


C 语言 描述 的 线性 表 动 态 分 配 顺 序 存 储 结构 ,其 类 型 定义 如 下 。 
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#define LIST INST SIZE 100 
#define LISTINCREMENT 10 
typedef struct { 


ElemType * elem; // 存 储 空间 基 址 

int length; // 当 前 长 度 

int listsize; // 当 前 分 配 的 存储 容量 
} sqList; // 俗 称 顺序 表 


在 线性 表 的 顺序 存储 结构 下 ,可 以 对 线性 表 进 行 各 种 处 理 。 主 要 的 运算 有 以 下 几 种 。 
1. 顺序 表 的 初始 化 


Status InitList Sq (SqList & L) { 
// 构 造 一 个 空 的 线性 表 工 
工 .elem = (ElemType * ) malloc (LIST INIT SIZE* sizeof (ElemType)); 
// 开 辟 一 段 内 存 空间 
if (!L.elem) exit (OVERFLOW); 
L.length =0; // 赋 上 首 地 址 和 初始 长 度 0 
L.listsize =LIST INIT SIZE; 
return OK; 


}//InitList Sq 
从 时 间 性 能 上 看 ,顺序 表 初 始 化 算法 的 时 间 复 杂 度 为 0(1)。 
2. 顺序 表 的 查找 运算 


int LocateElem Sq(SqList L, ElemType e, Status (* compare) (ElemType, ElemType)) { 
// 在 顺序 表 中 查询 第 一 个 满足 条 件 的 数据 元 素 , 若 存在 , 则 返回 它 的 位 序 , 否 则 返回 0 
i=1 
p=L.elem; 
while (i <=L.length && !(* compare) (x*p++, e)) ++i; 
if (i <=L.length) return i; 
else return 0; 

}//LocateElem Sq 


从 时 间 性 能 上 看 ,顺序 表 查 找 算法 的 时 间 复杂 度 为 O(ListLength(L) ) 。 
3. 顺序 表 中 插入 运算 


在 长 度 为 n 的 线性 表 中 插入 一 个 结 点 zx, 其 插入 过 程 如 下 : 首先 从 最 后 一 个 元 素 开始 直 
到 第 ;个 元 素 ,将 其 中 的 每 一 个 元 素 均 依 次 往 后 移动 一 个 位 置 ,然后 将 新 元 素 x 插入 到 第 i 
个 位 置 。 插 入 一 个 新 元 素 后 ,线性 表 的 长 度 变 成 了 十 1, 如 图 2. 2 所 示 , 其 中 ,maxsize 为 向 
计算 机 内 存 申请 的 最 大 存储 空间 ,last 为 线性 表 中 指向 最 后 一 个 元 素 的 指针 。 

一 般 情况 下 ,要 在 第 i 个 元 素 之 前 插入 一 个 新 元 素 时 ,首先 要 从 最 后 一 个 ( 即 第 个 ) 
元 素 开始 ,直到 第 i 个 元 素 之 间 共 nn 十 1 个 元 素 依次 向 后 移动 一 个 位 置 , 移 动 结束 后 ,第 i 
个 位 置 就 被 空 出 ,然后 将 新 元 素 插入 到 第 i 项。 插入 结束 后 ,线性 表 的 长 度 就 增加 了 1。 
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图 2.2 线性 表 在 顺序 存储 结构 下 的 插入 运算 


显然 ,在 线性 表 采 用 顺序 存储 结构 时 ,如 果 搬 和 人 运算 在 线性 表 的 末尾 进行 , 即 在 第 ” 
个 元 素 之 后 (可 以 认为 是 在 第 "十 1 个 元 素 之 前 ) 插 入 新 元 素 , 则 只 要 在 表 的 末尾 增加 一 个 
元 素 即 可 ,不 需要 移动 表 中 的 元 素 ; 如 果 要 在 线性 表 的 第 1 个 元 素 之 前 插入 一 个 新 元 素 ， 
则 需要 移动 表 中 所 有 的 元 素 。 一 般 情况 下 ,如 果 择 入 运算 在 第 i 个 元 素 之 前 进行 , 则 原来 
第 i 个 元 素 之 后 (包括 第 i 个 元 素 ) 的 所 有 元 素 都 必须 移动 。 平 均 情况 下 ,要 在 线性 表 中 
插入 一 个 新 元 素 ,需要 移动 表 中 一 半 的 元 素 。 因 此 ,在 线性 表 顺 序 存储 的 情况 下 ,要 插入 
一 个 新 元 素 ,其 效率 是 很 低 的 ,特别 是 在 线性 表 比 较 大 的 情况 下 表现 更 为 突出 ,因为 数据 
元 素 的 移动 会 消耗 较 多 的 处 理 时 间 。 
Status ListInsert Sql(SqList gL, int i, ElemType e) { 
// 在 顺序 表 工 的 第 i 个 元 素 之 前 插入 新 的 元 素 ev 
//i 的 合法 范围 为 1<i<L.length+1 
if (i <1 || i >L.length+1) return ERROR; // 插 入 位 置 不 合法 
if (L.length >=L.1listsize) { // 当 前 存储 空间 已 满 ,增加 分 配 
newbase = (ElemType * )realloc(L.elem, 
(L.listsize+LISTINCREMENT) * sizeof (ElemType)); 


if (!newbase) exit (OVERFLOW); // 存 储 分 配 失败 
L.elem =newbase; // 新 基 址 
L.listsize +=LISTINCREMENT; // 增 加 存储 容量 

} 

q=&(L.elem[i-1]); //q 指示 插入 位 置 


for (p=&L.elem[L.length-1]; p>=q ; --p)* (p+1) =*p; 
xq=e; ++L.length; 
return OK; 


}//ListIinsert sq 


从 时 间 性 能 上 看 ,插入 算法 的 时 间 复 杂 度 为 O(ListLength(CL))。 


4. 顺序 表 删 除 运 算 
一 个 长 度 为 n 的 线性 表 顺 序 存 储 在 长 度 为 maxsize 的 存储 空间 中 ,现在 要 求 删除 线 
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性 表 中 的 第 i 个 元 素 , 其 删除 过 程 如 下 。 
从 第 i 个 元 素 开始 直到 最 后 一 个 元 素 , 将 其 中 的 每 一 个 元 素 均 依次 往 前 移动 一 个 位 
置 。 此 时 ,线性 表 的 长 度 变 成 了 n 一 1, 如 图 2. 3 所 示 。 


删除 前 删除 后 前 移 后 
0 al a a 
1 2 @ oy 
六 2 OF OH ai 
删除 a 二 > 六 1 al : Gil 
Girl il QH2 
m2 [rm Ol last—> On 
last->n-1 On tn 
maxsize—l 


图 2.3 线性 表 在 顺序 存储 结构 下 的 删除 运算 


一 般 来 说 , 设 长 度 为 n 的 线性 表 为 (a1 ,a;，… ,ai,… ,a,), 现 要 删除 第 i 个 元 素 , 删 除 
后 长 度 为 n 一 1。 一 般 情况 下 ,要 删除 第 i 个 元 素 时 , 则 要 从 第 i 十 1 个 元 素 开始 ,直到 第 
个 元 素 依次 向 前 移动 一 个 位 置 。 删 除 结束 后 ,线性 表 的 长 度 就 减 小 了 1。 

显然 ,在 线性 表 采 用 顺序 存储 结构 时 ,如 果 删 除 运算 在 线性 表 的 末尾 进行 , 即 删除 第 
nn 个 元 素 , 则 不 需要 移动 表 中 的 元 素 ; 如 果 要 删除 线性 表 中 的 第 1 个 元 素 , 则 需要 移动 表 
中 所 有 的 元 素 。 一 般 情况 下 ,如 果 要 删除 第 i 个 元 素 , 则 原来 第 i 个 元 素 之 后 的 所 有 元 素 
都 必须 依次 往 前 移动 一 个 位 置 。 在 平均 情况 下 ,要 在 线性 表 中 删除 一 个 元 素 , 需 要 移动 表 
中 一 半 的 元 素 。 因 此 ,在 线性 表 顺 序 存储 的 情况 下 ,要 删除 一 个 元 素 ,其 效率 也 是 很 低 的 ， 
特别 是 在 线性 表 比 较 大 的 情况 下 表现 更 为 突出 ,因为 数据 元 素 的 移动 会 消耗 较 多 的 处 理 
时 间 。 

Status ListDelete Sq (SqList gL, int i, ElemType &e) { 

// 在 顺序 表 工 中 删除 第 i 个 位 置 的 元 素 e， 

// 并 将 删除 的 元 素 放 和 人 e 中 

if ((i <1) || (i >L.length)) return ERROR; 
p=&L.elem[i-1]; e=*p; 

q=L.elem +L.length-1; 

for (p=pt1l; p<=q; ++p) * (p-1)=*p; 
--L.length; 

return OK; 


}//ListDelete sq 


从 时 间 性 能 上 看 ,删除 算法 的 时 间 复 杂 度 为 O(ListLength(CL))。 

由 线性 表 在 顺序 存储 结构 下 的 插入 与 删除 运算 可 以 看 出 ,线性 表 的 顺序 存储 结构 对 
于 小 线性 表 或 者 其 中 元 素 不 常 变动 的 线性 表 来 说 是 合适 的 ,因为 顺序 存储 的 结构 比较 简 
单 。 但 这 种 顺序 存储 的 方式 对 于 元 素 经 常 需要 变动 的 大 线性 表 就 不 太 合 适 了 ,因为 插入 
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与 删除 的 效率 比较 低 。 


2.3 线性 表 的 链 式 存储 及 运算 实现 


前 面 主要 讨论 了 线性 表 的 顺序 存储 结构 以 及 在 顺序 存储 结构 下 的 运算 。 线 性 表 的 顺 
序 存储 结构 具有 结构 简单 .运算 方便 等 优点 ,特别 是 对 于 小 线性 表 或 长 度 固 定 的 线性 表 ， 
采用 顺序 存储 结构 的 优越 性 更 为 突出 。 但 是 ,线性 表 的 顺序 存储 结构 在 某 些 情况 下 就 显 
得 不 那么 方便 ,运算 效率 不 那么 高 。 实 际 上 ,线性 表 的 顺序 存储 结构 存在 以 下 三 方面 的 
缺点 。 

首先 ,在 一 般 情况 下 ,要 在 顺序 存储 的 线性 表 中 插入 一 个 新 元 素 或 删除 一 个 元 素 时 ， 
为 了 保证 插入 或 删除 后 的 线性 表 仍 然 为 顺序 存储 , 则 在 插入 或 删除 过 程 中 需要 移动 大 量 
的 数据 元 素 。 在 平均 情况 下 ,为 了 在 顺序 存储 的 线性 表 中 插入 或 删除 一 个 元 素 , 需 要 移动 
线性 表 中 约 一 半 的 元 素 ;在 最 坏 情况 下 , 则 需要 移动 线性 表 中 所 有 的 元 素 。 因 此 ,对 于 大 
的 线性 表 , 特 别 是 在 元 素 的 插入 或 删除 很 频繁 的 情况 下 ,采用 顺序 存储 结构 是 很 不 方便 
的 ,插入 与 删除 运算 的 效率 都 很 低 。 

其 次 , 当 为 一 个 线性 表 分 配 顺 序 存 储 空间 后 ,如 果 出 现 线性 表 的 存储 空间 已 满 ,但 还 
需要 插入 新 的 元 素 时 ,就 会 发 生 * 上 溢 ” 错 误 。 在 这 种 情况 下 ,如 果 在 原 线性 表 的 存储 空间 
后 找 不 到 与 之 连续 的 可 用 空间 , 则 会 导致 运算 的 失败 或 中 断 。 显 然 ,这 种 情况 的 出 现 对 运 
算是 很 不 利 的 。 也 就 是 说 ,在 顺序 存储 结构 下 ,线性 表 的 存储 空间 不 便于 扩充 。 

再 次 ,在 实际 应 用 中 ,往往 是 同时 有 多 个 线性 表 共 享 计 算 机 的 存储 空间 ,例如 ,在 一 个 
处 理 中 ,可 能 要 用 到 若干 个 线性 表 ( 包 括 栈 与 队列 )。 在 这 种 情况 下 ,存储 空间 的 分 配 将 是 
一 个 难题 。 如 果 将 存储 空间 平均 分 配给 各 线性 表 , 则 有 可 能 造成 有 的 线性 表 的 空间 不 够 
用 ,而 有 的 线性 表 的 空间 根本 用 不 着 或 用 不 满 ,这 就 使 得 在 有 的 线性 表 空间 无 用 而 处 于 空 
闲 的 情况 下 ,另外 一 些 线性 表 的 操作 由 于 “上 溢 ” 而 无 法 进行 。 这 种 情况 实际 上 是 计算 机 
的 存储 空间 得 不 到 充分 利用 。 如 果 多 个 线性 表 共享 存储 空间 ,对 每 一 个 线性 表 的 存储 空 
间 进 行动 态 分 配 , 则 为 了 保证 每 一 个 线性 表 的 存储 空间 连续 且 顺 序 分 配 ,会 导致 在 对 某 个 
线性 表 进 行动 态 分 配 存储 空间 时 ,必须 要 移动 其 他 线性 表 中 的 数据 元 素 。 这 就 是 说 ,线性 
表 的 顺序 存储 结构 不 便于 对 存储 空间 的 动态 分 配 。 

由 于 线性 表 的 顺序 存储 结构 存在 以 上 这 些 缺 点 ,因此 ,对 于 大 的 线性 表 , 特 别 是 元 素 
变动 频繁 的 大 线性 表 不 宜 采用 顺序 存储 结构 ,而 是 采用 下 面 将 要 介绍 的 另 一 种 存储 方 
式 一 一 链 式 存储 结构 ,简称 为 链表 (Linked List) 。 

假设 数据 结构 中 的 每 一 个 数据 结 点 对 应 于 一 个 存储 单元 ,这 种 存储 单元 称 为 存储 结 
点 ,简称 结 点 。 在 链 式 存储 方式 中 ,要 求 每 个 结 点 由 两 部 分 组 成 : 一 部 分 用 于 存放 数据 元 
素 值 , 称 为 数据 域 ; 另 一 部 分 用 于 存放 指针 , 称 为 指针 域 。 指 针 域 中 存储 的 信息 称 为 指针 
或 链 ,其 中 ,指针 用 于 指向 该 结 点 的 前 一 个 或 后 一 个 结 点 ( 即 前 驱 或 后 继 ) ,2 个 结 点 链接 
成 一 个 链表 。 在 链 式 存储 结构 中 ,存储 数据 结构 的 存储 空间 可 以 不 连续 ,各 数据 结 点 的 存 
储 顺 序 与 数据 元 素 之 间 的 逻辑 关系 可 以 不 一 致 ,而 数据 元 素 之 间 的 逻辑 关系 是 由 指针 域 
来 确定 的 。 
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线性 表 的 链 式 存储 结构 有 单 链表 、 双 链表 ,循环 链表 。 
2.3.1 链 式 存储 的 特点 


1. 单 链表 


为 了 存储 线性 表 中 的 每 一 个 元 素 ,正确 表示 结 点 之 间 的 关系 ,一 方面 要 存储 数据 元 素 
的 值 , 男 一 方面 要 存储 各 数据 元 素 之 间 的 前 后 继 关 系 。 因 此 ,通常 将 存储 空间 中 的 每 一 个 
存储 结 点 分 为 两 部 分 : 一 部 分 用 于 存储 数据 元 素 的 值 , 称 为 数据 域 ; 男 一 部 分 用 于 存放 下 
一 个 数据 元 素 的 存储 序号 ( 即 存储 结 点 的 地 址 ), 即 指向 后 继 结 点 , 称 为 指针 域 。 由 此 可 
知 ,在 线性 链表 中 ,存储 空间 的 结构 如 图 2. 4 所 示 。 其 中 ,Data 是 数据 域 ,用 来 存放 结 点 
的 值 ;Next 是 指针 域 ,用 来 存放 结 点 的 直接 后 继 地 址 。 由 于 链表 中 的 每 个 结 点 只 有 一 个 
链 域 , 故 将 这 种 链表 称 为 单 链 表 。 

在 单 链表 中 ,用 一 个 专门 的 指针 head 指向 线性 链表 中 第 一 个 数据 元 素 的 结 点 ( 即 存 
放 线 性 表 中 第 一 个 数据 元 素 的 存储 结 点 的 序号 )。 线 性 表 中 最 后 一 个 元 素 没有 后 继 , 因 
此 ,线性 链表 中 最 后 一 个 结 点 的 指针 域 为 空 (用 NULL 或 0 表示) ,表示 链表 终止 。 例 如 ， 
如 图 2. 5 所 示 是 一 个 线性 链表 示例 。 


M M 
130 eat 135 
135 cat 170 

| M M 


data next | M M 


图 2.4 链 式 存储 结构 图 2.5 线性 链表 示例 


其 对 应 单 链表 的 逻辑 结构 如 图 2. 6 所 示 。 


bat | eat cat or mat | 人 


head 
图 2.6 带头 结 点 的 单 链表 


一 般 来 说 ,在 线性 表 的 链 式 存储 结构 中 ,各 数据 结 点 的 存储 序号 是 不 连续 的 ,并 且 各 
结 点 在 存储 空间 中 的 位 置 关系 与 逻辑 关系 也 不 一 致 。 在 线性 链表 中 ,各 数据 元 素 之 间 的 
前 后 继 关 系 是 由 各 结 点 的 指针 域 来 指示 的 ,指向 线性 表 中 第 一 个 结 点 的 指针 head 称 为 头 
指针 , 当 head==NULL( 或 0) 时 称 为 空 表 。 对 于 线性 链表 ,可 以 从 头 指针 开始 , 沿 各 结 点 
的 指针 扫描 到 链表 中 的 所 有 结 点 。 

上 面 讨论 的 单 链表 中 ,每 一 个 结 点 只 有 一 个 指针 域 ,由 这 个 指针 只 能 找到 后 继 结 点 ， 
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但 不 能 找到 前 驱 结 点 。 因 此 ,在 这 种 线性 链表 中 ,只 能 顺 指 针 向 链 尾 方向 进行 扫描 ,这 对 
于 某 些 问题 的 处 理会 带 来 不 便 ,因为 在 这 种 链接 方式 下 ,由 某 一 个 结 点 出 发 ,只 能 找到 它 
的 后 继 ,而 为 了 找 出 它 的 前 驱 , 必 须 从 头 指 针 开 始 重 新 寻找 。 
C 语言 描述 的 单 链表 存储 结构 ,其 类 型 定义 如 下 。 
typedef struct LNode { 
ElemType data; 


struct LNode *next; 


} LNode, * LinkList; 
假设 二 是 LinkList 类 型 的 , 它 是 单 链表 的 头 指针 ,指向 表 中 第 一 个 结 点 。 
2. 循环 链表 


在 单 链表 中 ,只 有 从 头 结 点 出 发 才能 找到 链表 中 的 其 他 结 点 , 当 把 最 后 一 个 结 点 的 链 
域 指向 头 结 点 ,构成 一 个 环 时 , 称 为 循环 单 链 表 , 如 图 2.7 所 示 。 在 循环 单 链表 中 ,只 要 指 
出 表 中 任何 一 个 结 点 的 位 置 , 就 可 以 从 它 出 发 访问 到 表 中 其 他 所 有 的 结 点 ,而 线性 单 链表 
做 不 到 这 一 点 。 


a 才 eat | | cat “.. mat 
图 2.7 循环 单 链表 
另外 ,由 于 在 循环 链表 中 设置 了 一 个 表 头 结 点 ,因此 ,在 任何 情况 下 ,循环 链表 中 至 少 


有 一 个 结 点 存在 ,从 而 使 空 表 与 非 空 表 的 运算 统一 。 循 环 链表 的 插入 和 删除 的 方法 与 线 
性 单 链表 基本 相同 。 但 由 循环 链表 的 特点 可 以 看 出 ,在 对 循环 链表 进行 插入 和 删除 的 过 
程 中 ,实现 了 空 表 与 非 空 表 的 运算 统一 。 


3. 双向 链表 


为 了 弥补 线性 单 链表 的 缺点 ,在 某 些 应 用 中 ,对 线性 链表 中 的 每 个 结 点 设置 两 个 指 
针 , 一 个 称 为 左 指针 (Llink), 用 以 指向 其 前 驱 结 点 ; 另 
一 个 称 为 右 指针 (Rlink) ,用 以 指向 其 后 继 结 点 。 这 样 
的 线性 链表 称 为 双向 链表 ,其 逻辑 状态 如 图 2. 8 所 示 。 

C 语言 描述 的 双向 链表 存储 结构 ,其 类 型 定义 如 下 。 


Llink data Rlink 
图 2.8 双向 链表 示意 图 


typedef struct DuLNode { 
ElemType data; 
struct DuLNode * prior; 
struct DuLNode *next; 


} DuLNode, * DuLinkList 


双向 链表 的 “查询 ”操作 和 单 链表 相同 ,“ 插 入 ”和 “删除 ”时 需要 同时 修改 两 个 方向 上 
的 指针 。 
由 于 链表 在 空间 上 的 合理 利用 以 及 插入 、 删 除 时 不 需 移 动 元素 等 优点 ,因此 ,在 很 多 
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场合 下 ,链表 是 线性 表 的 首选 存储 结构 。 然 而 ,链表 也 存在 某 些 问题 : 单 链表 的 表 长 是 一 
个 隐 含 的 值 :在 链表 最 后 插入 元 素 时 , 需 遍 历 整个 链表 ;在 链表 中 ,位 序 ” 的 概念 已 淡化 ， 
而 被 数据 元 素 在 线性 链表 中 的 “位 置 "概念 所 代替 。 


2.3.2 链表 上 的 运算 实现 


以 单 链表 为 例 , 线 性 链表 的 运算 主要 有 以 下 几 个 。 
1. 线性 链表 的 创建 


链表 是 一 个 动态 的 结构 , 它 不 需要 分 配 空间 ,因此 生成 链表 的 过 程 是 一 个 个 结 点 “ 逐 
个 插入 ”的 过 程 。 例 如 ,要 逆序 输入 个 数据 元 素 的 值 ,建立 带头 结 点 的 单 链表 ,主要 思路 
是 首先 建立 一 个 头 结 点 ;逆序 创建 结 点 a;; 每 创建 一 个 结 点 都 将 其 插入 到 第 一 个 结 点 位 置 
上 ,直至 插入 a 为 止 。 

void CreateList 工 (LinkList gL, int n) { 


L=(LinkList) malloc (sizeof (LNode)); 
L->next =NULL; // 建 头 


站 
En 


for (i =n? 1 > 一 7 —-1)1 
p= (LinkList) malloc (sizeof (LNode)); 
scanf (gp->data); 
p->next =L->next; L->next =p; 
} 
}//CreateList L 


从 时 间 性 能 上 看 ,链表 创建 的 算法 时 间 复 杂 度 为 O(n)。 
2. 在 线性 链表 中 查找 指定 元 素 


单 链 表 是 一 种 顺序 存 取 的 结构 ,为 找到 第 i 个 数据 元 素 , 必 须 先 找到 第 i 一 1 个 数据 
元 素 。 查 找 第 i 个 数据 元 素 的 基本 操作 为 : 移动 指针 ,比较 ; 和 i。 指 针 p 始终 指向 线性 
表 中 第 j 个 元 素 。 


Status GetElem L(LinkList L, int i, ElemType &e) { 
p=L->next; j=1; 
while (p && j<i) {p=p->next; ++j; } 


// 顺 指针 查找 ,直到 p 指向 第 i 个 元 素 或 p 为 空 


i tp ll EY //i> 表 长 或 i<1 
return ERROR; // 第 工 个 元 素 不 存在 
e =p->data; // 取 得 第 i 个 元 素 


return OK; 


}//GetElem 工 


从 时 间 性 能 上 看 ,线性 链表 的 查找 算法 时 间 复 杂 度 为 O(ListLength(L))。 
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3. 线性 链表 的 插入 


在 对 线性 链表 进行 插入 或 删除 的 运算 中 ,总 是 首先 需要 找到 插入 或 删除 的 位 置 ,这 就 
需要 对 线性 链表 进行 扫描 查找 ,在 线性 链表 中 寻找 包含 指定 元 素 值 的 前 一 个 结 点 。 当 找 
到 包含 指定 元 素 的 前 一 个 结 点 后 ,就 可 以 在 该 结 点 后 插入 新 结 点 或 删除 该 结 点 后 的 一 个 


结 点 。 


线性 链表 的 插入 是 指 在 链 式 存储 结构 下 的 线性 表 中 插入 一 个 新 元 素 。 为 了 要 在 线性 
链表 中 插入 一 个 新 元 素 ,首先 要 给 该 元 素 分 配 一 个 新 结 点 ,以 便 用 于 存储 该 元 素 的 值 。 然 


后 将 存放 新 元 素 值 的 结 点 链接 到 线性 链表 中 指定 的 位 置 。 


在 p 指针 后 插入 新 结 点 ,其 插入 过 程 如 图 2.9 所 示 。 


bat + eat cat 


head 


|: :| 


图 2.9 线性 链表 的 插入 


由 线性 链表 的 插入 过 程 可 以 看 出 ,线性 链表 在 插入 过 程 中 不 发 生 数据 元 素 移动 的 现 


象 ,只 需 改变 有 关 结 点 的 指针 即 可 ,从 而 提高 了 插入 的 效率 。 


Status ListInsert L(LinkList L, int i, ElemType e) { 


//I 为 带头 结 点 的 单 链表 的 头 指针 

p=L; j=0; 

while (p && j <i-1) {p=p->next; ++j; } 
if (!p || j >i-1) return ERROR; 
s=(LinkList) malloc ( sizeof (LNode)); 
s->data =e; 

s->next =p->next; p->next =s; 
return OK; 


}//ListIinsert L 


从 时 间 性 能 上 看 ,线性 链表 的 插入 算法 时 间 复 杂 度 为 O(ListLength(L))。 


4. 线性 链表 的 删除 

线性 链表 的 删除 是 指 在 链 式 存储 结构 下 的 线性 表 中 删除 包含 指定 元 素 的 结 点 。 为 了 
在 线性 链表 中 删除 包含 指定 元 素 的 结 点 ,首先 要 在 线性 链表 中 找到 这 个 结 点 ,然后 将 要 删 
除 结 点 放 回 到 存储 池 。 

假设 可 利用 的 线性 链表 如 图 2. 10 所 示 。 现 在 要 在 线性 链表 中 删除 包含 元 素 x 的 结 
点 ,其 删除 过 程 如 下 。 

(1) 在 线性 链表 中 寻找 包含 元 素 x 的 前 一 个 结 点 , 设 该 结 点 序号 为 p。 


(2) 将 结 点 p 后 的 结 点 从 线性 链表 中 删除 。 
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bat 才 | > cat 
本 3 


存储 池 
图 2.10 线性 链表 删除 


(3) 将 结 点 + 送 回 存储 池 。 此 时 ,线性 链表 的 删除 运算 完成 。 


Status ListDelete 工 (LinkList L, int i, ElemType &e) { 
p=L;j=0; 
while (p->next && j <i-1) 
{p=p->next; ++j; } // 找 前 驱 (i-1) 
if (!(p->next) || j >i-1) return ERROR; 
q =p->next; p->next =q->next; 
e=q->data; free(q); 
return OK; 


}//ListDelete L 


从 时 间 性 能 上 看 ,线性 链表 的 删除 算法 时 间 复 杂 度 为 O(ListLength(L))。 
小 结 


本 章 的 基本 内 容 是 : 线性 表 的 逻辑 结构 定义 和 各 种 存储 结构 的 描述 方法 ;在 线性 表 
的 两 类 存储 结构 ( 即 顺 序 表 和 链表 ) 上 如 何 实现 基本 操作 。 

(1) 线性 表 是 一 种 比较 简单 的 数据 结构 , 它 是 个 结 点 的 有 限 序列 。 线 性 表 常 用 的 
存储 方式 有 两 种 : 顺序 存储 结构 和 链 式 存储 结构 。 

(2) 线性 表 的 顺序 存储 是 利用 结 点 的 存储 位 置 来 反映 结 点 的 逻辑 关系 , 结 点 的 逻辑 
次 序 与 存储 空间 中 的 物理 次 序 一 致 ,因而 只 要 确定 了 线性 表 中 起 始 结 点 的 存储 位 置 , 即 可 
方便 地 计算 出 任 一 结 点 的 存储 位 置 , 所 以 可 以 实现 结 点 的 随机 访问 。 在 顺序 表 中 只 需 存 
放 结 点 自身 的 信息 ,因此 ,存储 密度 大 ,空间 利用 率 高 。 但 在 顺序 表 中 , 结 点 的 插入 、 删 除 
运算 可 能 需要 移动 许多 其 他 结 点 的 位 置 ,一 些 长 度 变化 较 大 的 线性 表 必须 按照 最 大 需要 
的 空间 分 配 存储 空间 ,这 些 都 是 线性 表 顺 序 存 储 结构 的 缺点 。 

(3) 线性 表 的 链 式 存 储 是 通过 结 点 之 间 的 链接 而 得 到 的 , 结 点 之 间 的 逻辑 次 序 与 存 
储 空间 中 的 物理 次 序 不 一 定 相 同 , 是 通过 给 结 点 附加 一 个 指针 域 来 表示 结 点 之 间 的 逻辑 
关系 。 根 据 连 接 方 式 又 可 以 分 为 : 单 向 链表 ,双向 链表 和 循环 链表 等 。 

(4) 单 向 链表 由 一 个 数据 域 (Data) 和 一 个 指针 域 (Next) 组 成 ,数据 域 用 来 存放 结 点 
的 信息 ;指针 域 指出 表 中 下 一 个 结 点 的 地 址 。 在 单 向 链表 中 ,只 能 从 某 个 结 点 出 发 找 它 的 
后 继 结 点 。 单 向 链表 最 大 的 优点 是 表 的 扩充 容易 ,插入 和 删除 操作 方便 ,而 缺点 是 每 个 结 
点 中 的 指针 域 需要 额外 占用 空间 ,比较 浪费 存储 空间 。 

(5) 将 单 链表 加 以 改进 可 得 到 循环 链表 和 双向 链表 。 在 循环 链表 中 ,使 最 后 一 个 结 
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点 的 指针 指向 头 结 点 (或 开始 结 点 ) 的 地 址 ,形成 一 个 首尾 连接 的 环 , 所 以 从 任 一 结 点 开始 
都 可 以 扫描 此 线性 表 中 的 每 个 结 点 。 

(6) 双向 链表 由 一 个 数据 域 (Data) 和 两 个 指针 域 (Llink 和 Rlink) 组 成 , 既 有 指向 直 
接 后 继 的 指针 ,又 有 指向 直接 前 趋 的 指针 , 它 的 优点 是 既 能 找到 结 点 的 前 驱 , 又 能 找到 结 
点 的 后 继 。 


习题 


2.1 什么 是 线性 表 ? 线性 表 的 逻辑 结构 是 什么 ? 
2.2 线性 表 有 哪 两 种 存储 结构 ? 各 自 的 优 缺 点 是 什么 ? 


27 


第 3 章 ”特殊 线性 表 


本 章 学 习 目标 
。 理解 栈 的 定义 及 存储 结构 。 
。 理解 队列 的 定义 及 存储 结构 。 
。 理解 串 的 定义 及 存储 结构 。 


本 章 介绍 栈 . 队 列 和 串 等 在 软件 设计 中 常用 的 几 种 数据 结构 ,它们 的 逻辑 结构 和 线性 
表 相 同 。 其 特点 在 于 运算 受到 了 限制 : 栈 按 * 后 进 先 出 的 规则 进行 操作 ,队列 按 * 先 进 先 
出 ?的 规则 进行 操作 , 故 称 运算 受 限制 的 线性 表 ; 串 的 特殊 性 体现 在 组 成 串 的 结 点 是 单个 
字符 ,所 以 存储 时 有 一 些 特殊 的 技巧 。 


3.1 栈 


3.1.1 栈 的 定义 


栈 实际 上 也 是 线性 表 , 只 不 过 是 一 种 特殊 的 线性 表 。 在 这 种 特殊 的 线性 表 中 ,其 插入 

与 删除 运算 都 只 在 线性 表 的 一 端 进行 。 即 在 这 种 线性 表 的 结 

三 构 中 ,一 端 是 封闭 的 ,不 允许 插入 与 删除 元 素 ; 另 一 端 是 开口 

| “| 的 ,允许 插入 与 删除 元 素 。 在 顺序 存储 结构 下 ,对 这 种 类 型 线 

性 表 的 插入 与 删除 运算 是 不 需要 移动 表 中 其 他 数据 元 素 的 。 

人 这 种 线性 表 称 为 栈 。 栈 (Stack) 是 限定 在 一 端 进 行 插入 与 删除 

的 线性 表 , 其 示意 图 如 图 3. 1 所 示 。 

在 栈 中 ,允许 插入 与 删除 的 一 端 称 为 栈 顶 ,而 不 允许 插入 

的 与 删除 的 另 一 端 称 为 栈 底 。 栈 顶 元 素 总 是 最 后 被 插入 的 元 素 ， 

栈 底 一 -| al 从 而 也 是 最 先 能 被 删除 的 元 素 ; 栈 底 元 素 总 是 最 先 被 插入 的 元 

素 , 从 而 也 是 最 后 才能 被 删除 的 元 素 。 即 栈 是 按照 “先进 后 出 ” 

(First In Last Out, FILO) 或 “后 进 先 出 ”(Last In First Onut， 

LIFO) 的 原则 组 织 数 据 的 ,因此 , 栈 也 被 称 为 “先进 后 出 ” 表 或 

“后 进 先 出 ? 表 。 通 常用 指针 top 来 指向 栈 顶 的 位 置 ,用 指针 bottom 指向 栈 底 的 位 置 。 往 

栈 中 插入 一 个 元 素 称 为 人 栈 运算 ,从 栈 中 删除 一 个 元 素 ( 即 删除 栈 顶 元 素 ) 称 为 出 栈 运算 。 
栈 的 操作 只 能 在 栈 顶 进行 , 栈 顶 指针 top 动态 反映 了 栈 中 元 素 的 变化 情况 。 

栈 这 种 数据 结构 在 日 常生 活 中 也 是 很 常见 的 。 例 如 ,子弹 夹 就 是 一 种 栈 的 结构 ,最 后 

压 人 的 子弹 总 是 最 先 被 弹出 ,而 最 先 压 人 的 子弹 最 后 才能 被 弹出 。 又 如 ,在 用 一 端 为 封闭 


栈 顶 一 a 


图 3.1 栈 的 示意 图 


另 一 端 为 开口 的 容器 装 物品 时 ,也 是 遵循 "先进 后 出 ?或 "后进 先 出 ?原则 的 。 
抽象 数据 类 型 栈 的 定义 如 下 。 


RDT Stack { 


数据 对 象 :Dp={ aizl aiEElemset，i=1y2， vpnrn>01} 


数据 关系 :R={ <as11as> 1asira:€D1i=2,… 1n} 


约定 as 端 为 栈 顶 ,ai 端 为 栈 底 。 


基本 操作 :P= { 初 始 化 栈 ,销毁 栈 , 人 栈 必 "} 


} ADT Stack 


栈 的 基本 操作 有 以 下 几 种 。 


(1) 初始 化 操作 : InitStack(&S) 。 


初始 条 件 : 栈 S 不 存在 。 
操作 结果 : 构造 一 个 空 栈 。 


(2) 销毁 操作 : DestroyStack(&S) 。 


初始 条 件 : 栈 S 已 存在 。 
操作 结果 : 栈 S 被 销毁 。 


(3) 搬入 元 素 操作 : Push(&S, e)。 


初始 条 件 : 栈 S 已 存在 。 


操作 结果 : 插 和 元素 e 为 新 的 栈 顶 元 素 。 

(4) 删除 元 素 操作 : Pop(&S，&e)。 
初始 条 件 : 栈 S 已 存在 且 非 空 。 

操作 结果 : 删除 S 的 栈 顶 元 素 , 用 返回 其 值 。 


3.1.2 栈 的 存储 及 运算 实现 


特殊 线性 表 


与 一 般 的 线性 表 一 样 ,在 程序 设计 语言 中 ,用 一 维 数组 SC1 : m) 作 为 人 栈 出 栈 的 顺 
序 存储 空间 ,其 中 ,m 为 栈 的 最 大 容量 。 通 常 , 栈 底 指 针 指 向 栈 空 间 的 低地 址 一 端 ( 即 数 
组 的 起 始 地 址 这 一 端 ) 。 如 图 3. 2 所 示 ,图 3. 2(a) 是 容量 为 10 的 栈 顺序 存储 空间 , 栈 中 
已 有 6 个 元 素 ; 图 3.2(b) 与 图 3. 2(c) 分 别 为 入 栈 与 出 栈 后 的 状态 。 


10 
9 
8 
有 
top 6 F 
5 E 
4[ DD 
3 C 
2 2 
bottom 1 4 
(a) 有 6 个 元 素 的 栈 


10 
9 
top8 Y 
尝 xX 
6 F 
5 E 
4 D 
3 C 
和 B 
bottom 1 4 
(b) 插 入 X 和 7 了 的 栈 


图 3.2 入 栈 和 出 栈 示意 图 


10 
9 
8 
top7 XxX 
6 F 
5 E 
4 D 
3 C 
2 B 
bottom 1 4 


(c) 退出 一 个 元 素 的 栈 
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和 线性 表 类 似 , 栈 也 有 两 种 存储 表示 方法 , 即 顺序 栈 和 链 栈 。 以 顺序 栈 为 例 , 栈 的 顺 
序 存储 结构 ,其 类 型 定义 如 下 。 


#define STRCK INIT SIZE 100; 
#define STACKINCREMENT 10; 
typedef struct { 
SElemType * base; 
SElemType * top; 


int stacksize; // 当 前 可 用 容量 
} sqstack; 
栈 的 基本 运算 有 4 种 : 初始 化 .入 栈 、 出 栈 与 读 栈 项 元 素 。 下 面 分 别 介绍 在 顺序 存储 
结构 下 栈 的 这 几 种 运算 。 
1. 初始 化 运算 


Status InitStack (SqStack &S) { 
// 构 造 一 个 空 栈 S 
S.base = (SElemType * )malloc(STRCK_INIT_SIZEx sizeof (SElemType)); 
if (!S.base) exit (OVERFLOW); // 存 储 分 配 失败 
S.top =S.base; 
S.stacksize =STACK INIT SIZE; 


return OK; 


2. 入 栈 运算 


入 栈 运 算是 指 在 栈 项 位 置 插入 一 个 新 元 素 。 这 个 运算 有 两 个 基本 操作 : 首先 将 栈 项 
指针 进 1( 即 top 十 1) ,然后 将 新 元 素 插入 到 栈 顶 指针 指向 的 位 置 。 当 栈 顶 指针 已 经 指向 
存储 空间 的 最 后 一 个 位 置 时 ,说 明 栈 空间 已 满 , 不 可 能 再 进行 人 栈 操作 。 这 种 情况 称 为 栈 
“上 溢 ” 错 误 。 

Status Push (SqStack &S, SElemType e) { 

if (S.top -S.base >=S.stacksize) { // 栈 满 , 追 加 存储 空间 
S.base = (SElemType * ) realloc (S.base, 
(S.stacksize +STACKINCREMENT) * sizeof (SElemType)); 
//= (int x*) realloc ( S.base, 总 长 度 ) (当前 长 度 + 增 量 ) * sizeof (int) 
if (!S.base) exit (OVERFLOW); // 存 储 分 配 失败 
S.top =S.base +S.stacksize; 
S.stacksize +=STACKINCREMENT; 
} 
x* S.topt++=e; 


return OK; 
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3. 出 栈 运算 


出 栈 运 算是 指 取 出 栈 项 元 素 并 将 其 赋 给 一 个 指定 的 变量 。 这 个 运算 有 两 个 基本 操 
作 : 首先 将 栈 顶 元 素 ( 栈 顶 指针 指向 的 元 素 ) 赋 给 一 个 指定 的 变量 ,然后 将 栈 顶 指针 退 1 
( 即 top 一 1) 。 当 栈 顶 指针 为 0 时 ,说 明 栈 空 ,不 可 能 进行 出 栈 操作 。 这 种 情况 称 为 栈 “ 下 
滋 " 错 误 。 
Status Pop (SqStack &S, SElemType &e) { 
// 若 栈 不 空 , 则 删除 s 的 栈 顶 元 素 , 用 e 返回 其 值 ,并 返回 OK 
if (S.top ==S.base) return ERROR; 
e=*--S.top; 
return OK; 


} 


4. 读 栈 顶 元 素 


读 栈 顶 元 素 是 指 将 栈 顶 元 素 赋 给 一 个 指定 的 变量 。 必 须 注意 ,这 个 运算 不 会 删除 栈 
顶 元 素 , 只 是 将 它 的 值 赋 给 一 个 变量 ,因此 ,在 这 个 运算 中 , 栈 顶 指针 不 会 改变 。 当 栈 顶 指 
针 为 0 时 ,说 明 栈 空 , 读 不 到 栈 顶 元 素 。 
Status GetTop (SqStack Ss, SElemType &e) { 
// 若 栈 不 空 , 则 用 e 返回 s 的 栈 顶 元 素 , 并 返回 OK, 否则 返回 ERROR 
if (S.top ==S.base) return ERROR; 
e=*(S.top -1); 
return OK; 


}//GetTop 


3.2 队列 


3.2.1 队列 的 定义 


在 计算 机 系统 中 ,如 果 一 次 只 能 执行 一 个 用 户 程序 , 则 在 需要 执行 多 个 用 户 程序 时 ， 
这 些 用 户 程序 必须 先 按照 到 来 的 顺序 进行 排队 等 待 。 这 通常 是 由 计算 机 操作 系统 来 进行 
管理 的 。 在 操作 系统 中 ,用 一 个 线性 表 来 组 织 管理 用 户 程序 的 排队 执行 ,其 原则 有 以 下 
几 点 。 

(1) 初始 时 线性 表 为 空 ; 

(2) 当 有 用 户 程序 到 来 时 ,将 该 用 户 程序 加 入 到 线性 表 的 末尾 进行 等 待 ; 

(3) 当 计 算 机 系统 执行 完 当 前 的 用 户 程序 后 ,就 从 线性 表 的 头 部 取出 一 个 用 户 程 序 
执行 。 

由 此 可 以 看 出 ,在 这 种 线性 表 中 ,需要 加 入 的 元 素 总 是 插 和 人 到 线性 表 的 末尾 ,并 且 又 
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总 是 从 线性 表 的 头 部 取出 (删除 ) 元 素 。 这 种 线性 表 称 为 队列 。 

队列 (Queue) 是 指 人 允许 在 一 端 进行 插入 而 在 另 一 端 进行 删除 的 线性 表 。 人 允许 插入 的 
一 端 称 为 队 尾 , 通 常用 一 个 称 为 尾 指针 (rear) 的 指针 指向 队 尾 元 素 , 即 尾 指针 总 是 指向 最 
后 被 插入 的 元 素 ;允许 删除 的 一 端 称 为 队 头 ,通常 用 一 个 称 为 头 指针 (front) 的 指针 指向 
队 头 元 素 。 显 然 , 在 队列 这 种 数据 结构 中 ,最 先 插入 的 元 素 将 最 先 能 够 被 删除 ,反之 ,最 后 
插入 的 元 素 将 最 后 才能 被 删除 。 因 此 ,队列 又 称 为 “先进 先 出 ”的 线性 表 , 它 体现 了 “ 先 来 
先 服务 ”的 原则 。 在 队列 中 , 队 尾 指针 rear 与 排头 指针 front 共同 反映 了 队列 中 元 素 动态 
变化 的 情况 。 图 3. 3 是 具有 6 个 元 素 的 队列 示意 图 。 


wm TT Ts TT Te Tr Tm 


front rear 


图 3.3 6 个 元 素 的 队列 示意 图 


向 队列 的 队 尾 插入 一 个 元 素 称 为 人 队 运 算 , 从 队列 的 队 头 删 除 一 个 元 素 称 为 出 队 运 
算 。 由 图 3.4 可 以 看 出 ,在 队列 的 末尾 插入 一 个 元 素 ( 入 队 运 算 ) 只 涉及 队 尾 指针 rear 的 
变化 ,而 要 删除 队列 中 的 队 头 元 素 (出 队 运算 ) 只 涉及 队 头 指针 front 的 变化 。 

与 栈 类 似 , 在 程序 设计 语言 中 ,用 一 维 数组 作为 队列 的 顺序 存储 空间 。 


front front 
4 front 4 
B B B 
C GC C 
rear D rear D D 
rear E 


(a) 一 个 队列 (b) 删除 一 个 元 素 后 的 队列 。 (6) 插入 一 个 元 素 后 的 队列 
图 3.4 队列 运算 示意 图 


抽象 数据 类 型 队列 的 定义 如 下 。 


ADT Queue { 
数据 对 象 :D={ ai| a; EElemSset, i=1,2,*…,n,n 之 0 } 
数据 关系 :R={ <arivai>latrirazEDii=2 必 yl} 
约定 其 中 ai 端 为 队 头 , an 端 为 队 尾 
基本 操作 :P= {初始 化 队列 ,入 队 操 作 , 出 队 操 作 ,… } 
} ADT Queue 


队列 的 基本 操作 有 以 下 几 种 。 

(1) 初始 化 操作 : InitQueue(&Q) 。 
初始 条 件 : 队列 Q 不 存在 。 

操作 结果 : 构造 一 个 空 队列 Q。 

(2) 读 队 头 元 素 : GetHead(Q,，&e)。 
初始 条 件 : Q 为 非 空 队列 。 
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操作 结果 : 用 e 返回 Q 的 队 头 元 素 。 

(3) 入 队 操作 : EnQueue(&Q, e)。 

初始 条 件 : 队列 Q 已 存在 。 

操作 结果 : 插 和 人 元素。 为 Q 的 新 的 队 尾 元 素 。 
(4) 出 队 操作 : DeQueue(&Q，&e) 。 

初始 条 件 : Q 为 非 空 队列 。 

操作 结果 : 删除 Q 的 队 头 元 素 , 并 用 返回 其 值 。 


3.2.2 队列 的 存储 及 运算 实现 


和 线性 表 类 似 ,队列 也 可 以 有 两 种 存储 表示 : 循环 队列 和 链 队 列 。 在 实际 应 用 中 , 队 
列 的 顺序 存储 结构 一 般 采 用 循环 队列 的 形式 。 


1. 循环 队列 
所 谓 循环 队列 ,就 是 将 队列 存储 空间 的 最 后 一 个 位 置 绕 到 第 一 个 位 置 ,队列 循环 
使 用 ,如 图 3.5 所 示 。 在 循环 队列 结构 中 , 当 存储 空间 的 最 Ol:m) 


后 一 个 位 置 已 被 使 用 而 再 要 进行 信 队 运 算 时 ,只 要 存储 空间 i 
的 第 一 个 位 置 空闲 , 便 可 将 元 素 加 入 到 第 一 个 位 置 , 即 将 存 
储 空间 的 第 一 个 位 置 作为 队 尾 。 在 循环 队列 中 ,用 队 尾 指针 
rear 指向 队列 中 的 队 尾 元 素 , 用 队 头 指针 front 指向 队 头 元 素 2 
的 前 一 个 位 置 , 因 此 ,从 队 头 指针 front 指向 的 后 一 个 位 置 直 EL 
到 队 尾 指针 rear 指向 的 位 置 之 间 所 有 的 元 素 均 为 队列 中 的 
元 素 。 循环 队列 的 初始 状态 为 空 , 即 rear= front 二 =m, 如 


图 3.5 循环 队列 存储 
空间 示意 图 


图 3.6 所 示 。 
Q(1:7) Q(1:7) Q(1:7) 

7 8 X 7 下 

rear 6 E 6 E 6 E 
5 D 5 D 5 D 
4 他 4 C 4 C 
3 B 3 B 3 B 
1 4A front 2 4 Tear 2 A 

front 1 rear 1 上 front 1 
(a) 循环 队列 (b) 加 入 YX 工 的 循环 队列 (0) 退出 一 个 元 素 的 循环 队列 


图 3.6 循环 队列 运算 


队列 的 顺序 存储 结构 和 顺序 栈 类 似 。 由 于 队列 的 操作 是 在 两 端 进行 的 ,为 了 方便 操 
作 , 采 用 以 下 的 顺序 存储 结构 ,其 类 型 定义 为 : 


#define MAXQSIZE 100 // 最 大 队列 长 度 
typedef struct { 


QElemType * base; // 队 列 的 基地 址 
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int front; // 头 指针 
int rear; // 尾 指针 
} SqQueue; 
循环 队列 主要 有 两 种 基本 运算 : 入 队 运 算 和 出 队 运 算 。 
1) 入 队 运算 


入 队 运 算是 指 在 循环 队列 的 队 尾 加 入 一 个 新 元 素 。 这 个 运算 有 两 个 基本 操作 : 首先 将 
队 尾 指针 加 1( 即 rear 十 1) ,然后 将 新 元 素 插入 到 队 尾 指针 指向 的 位 置 。 当 循环 队列 非 空 且 
队 尾 指针 等 于 队 头 指针 时 ,说 明 循 环 队列 已 满 ,不 能 进行 入 队 运算 ,该 情况 称 为 “上游 ”。 


Status EnQueue (SqQueue g&Q, ElemType e) { 
if ((Q.rear+1) $MAXQSIZE ==Q.front) 
return ERROR; // 队 列 满 
Q.base[Q.rear] =e; 
Q.rear = (Q.rear+1) %MAXQSIZE; 
return OK; 
} 
2) 出 队 运 算 
出 队 运 算是 指 在 循环 队列 的 队 头 位 置 退 出 一 个 元 素 并 赋 给 指定 的 变量 。 这 个 运算 有 
两 个 基本 操作 : 首先 将 队 头 指针 进 1( 即 front 二 front 十 1) ;然后 将 队 头 指针 指向 的 元 素 赋 
给 指定 的 变量 。 当 循环 队列 为 空 时 ,不 能 进行 出 队 运 算 ,这 种 情况 称 为 "下 溢 ”。 
Status DeQueue (SqQueue &Q, ElemType &e) { 
if (Q.front ==Q.rear) return ERROR; 
e =Q.base[Q.front]; 
Q.front = (Q.front+1) %MAXQSIZE; 


return OK; 


， 


2. 链 队 列 


用 链表 表示 的 队列 简称 为 链 队列 。 一 个 链 队列 显然 需要 一 个 头 指 针 和 一 个 尾 指针 才 
能 唯一 确定 。 为 了 操作 方便 起 见 , 给 链 队列 添加 了 一 个 表 头 结 点 ,并 令 头 指 针 指 向 表 头 
结 点 。 

链 队列 结构 的 类 型 定义 如 下 : 


typedef struct QNode { // 结 点 类 型 
QElemType data; 
struct QNode * next; 


} QNode, * QueuePtr; 


typedef struct { // 链 队列 类 型 
QueuePtr front; // 队 头 指针 
QueuePtr rear; // 队 尾 指针 


} LinkQueue; 
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1) 初始 化 操作 


Status InitQueue (LinkQueue &Q) { 
// 构 造 一 个 空 队 列 8 
Q.front =Q.rear = (QueuePtr)malloc (sizeof (QNode)); 
if (!Q.front) exit (OVERFLOW ); // 存 储 分 配 失败 
Q.front->next =NULL; 
return OK; 
} 


2) 入 队 运 算 


Status EnQueue (LinkQueue &Q, QElemType e) { 
// 插 入 元 素 e 为 8 的 新 的 队 尾 元 素 
p= (QueuePtr) malloc (sizeof (QNode)); 
if (!p) exit (OVERFLOW); // 存 储 分 配 失败 
p->data =e; p->next =NULL; 
Q.rear->next =p; Q.rear =p; 
return OK; 


} 
3) 出 队 运 算 


Status DeQueue (LinkQueue &Q, QElemType &e) { 
if (Q.front ==Q.rear) return ERROR; 
p=Q.front->next; e =p->data; 
Q.front->next =p->next; 
if (Q.rear ==p) Q.rear =Q.front; 


free (p); return OK; 


3.3 串 


3.3.1 串 的 定义 


串 (String) 是 字符 串 的 简称 。 它 是 一 种 在 数据 元 素 的 组 成 上 具有 一 定 约束 条 件 的 线 
性 表 , 即 要 求 组 成 线性 表 的 所 有 数据 元 素 都 是 字符 ,所 以 ,人 们 经 常 又 这 样 定义 串 : 串 是 
有 限 长 的 字符 序列 。 串 一 般 记 作 

5 一 Qiaz…as (1 二 0) 

其 中 ,s 是 串 的 名 称 , 用 单 引 号 括 起 来 的 字符 序列 是 串 的 值 ;a; 可 以 是 字母 .数字 或 其 他 字 
符 ; 串 中 字符 的 数 日 n 被 称 作 串 的 长 度 。 当 ==0 时 , 串 中 没有 任何 字符 ,其 串 的 长 度 为 
0, 通 常 被 称 为 空 串 。 

串 中 任意 连续 的 字符 组 成 的 子 序列 被 称 为 该 串 的 子 串 。 包 含 子 串 的 串 又 被 称 为 该 子 
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串 的 主 串 。 通 常 称 字符 在 序列 中 的 序号 为 该 字符 在 串 中 的 位 置 。 称 两 个 串 是 相等 的 , 当 
且 仅 当 两 个 串 的 长 度 相等 ,并 且 各 个 对 应 的 字符 也 都 相同 。 
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抽象 数据 类 型 串 的 定义 如 下 。 


RDT String { 
数据 对 象 :D={ ailaiE characterSet,i=1y2, yn nn 二 0 } 
数据 关系 :R={ <aiivai>lairivaiEDri=2 yl} 
基本 操作 :P= {初始 化 串 , 串 的 连接 , 串 的 比较 ,… } 

} ADT String 


串 的 基本 操作 有 以 下 几 种 。 
(1) 清除 操作 : ClearString (&S) 。 
初始 条 件 : 串 S 存在 。 
操作 结果 : 将 S 清 为 空 串 。 
(2) 定位 操作 : Index (S, 下, pos)。 
初始 条 件 : 串 S 和 工 存 在 ,T 是 非 空 串 ,1 志 pos 信 StrLength(S)。 
操作 结果 : 若 S 在 第 pos 位 置 后 存在 和 工 值 相同 的 子 串 , 则 返回 第 一 次 出 现 工 的 位 
置 ;否则 返回 0。 
例如 : S='aabcababcaabca', T=='abe' 
Index(S, T, 4) = 7; 
Index(S, T, 12) = 0; 
(3) 串 替换 操作 : Replace (&S, T,V)。 
初始 条 件 : 串 S,T 和 V 均 已 存在 , 且 了 是 非 空 串 。 
操作 结果 : 用 V 替换 主 串 S 中 出 现 的 所 有 与 (模式 串 )T 相等 的 不 重生 的 子 串 。 
例如 : S='aabcababcaabca', T=='abc',V 二 'S' 
Replace(&S, T, V); 经 置换 后 得 到 S=='aSabSaSa' 
(4) 串 插 入 操作 : StrInsert (&S, pos, T)。 
初始 条 件 : 串 S 和 T 荆 存在 ,1 志 pos 和 StrLength(S) 十 1。 
操作 结果 : 在 S 的 第 pos 个 字符 前 插入 工 。 
例如 : S 一 chater',T 一 rac'， 
则 执行 StrInsert(S, 4, T) 之 后 得 到 S='character'。 
(5) 串 删 除 操作 : StrDelete (&S, pos, len) 。 
初始 条 件 : 串 S 存在 ,1 和 pos 委 StrLength(S) 一 len 十 1。 
操作 结果 : 从 串 S 中 第 pos 个 字符 起 删除 长 度 为 len 的 子 串 。 
(6) 串 连接 操作 : Concat (&T, Si， S,). 
初始 条 件 : 串 S, 和 Ss 存在 。 
操作 结果 : 用 返回 由 S; 和 S, 连接 而 成 的 新 串 。 
例如 : Concat ( 工 , Tam a student”) 
求 得 : T= Tam a student'。 


特殊 线性 表 


(7) 求 子 串 : SubString (&Sub, S， pos，len) 。 

初始 条 件 : 串 S 存在 ,1 二 pos 亿 StrLength(S) 且 0<len<StrLength(S) 一 pos 十 1。 

操作 结果 : 用 Sub 返回 串 S 的 第 pos 个 字符 起 长 度 为 len 的 子 串 。 

例如 : SubString ( sub, iindoor', 3, 4) 

求 得 : sub = 'door'。 

对 于 串 的 基本 操作 集 可 以 有 不 同 的 定义 方法 ,在 使 用 高 级 程序 设计 语言 中 的 串 类 型 
时 ,应 以 该 语言 的 参考 手册 为 准 。 串 的 逻辑 结构 和 线性 表 极为 相似 ,区 别 仅 在 于 串 的 数据 
对 象 约束 为 字符 集 。 而 串 的 基本 操作 和 线性 表 有 很 大 差别 : 在 线性 表 的 基本 操作 中 ,大 
多 以 “单个 元 素 ” 作 为 操作 对 象 ; 在 串 的 基本 操作 中 ,通常 以 “ 串 的 整体 "作为 操作 对 象 。 


3.3.2 串 的 存储 


在 程序 设计 语言 中 ,如 果 串 只 是 作为 输入 或 输出 的 常量 出 现 , 则 只 需 存 储 此 串 的 串 
值 , 即 字符 序列 即 可 。 但 在 多 数 非 数值 处 理 的 程序 中 , 串 也 以 变量 的 形式 出 现 。 

串 的 定 长 顺序 存储 类 似 于 线性 表 的 顺序 存储 结构 ,其 定义 表示 为 : 

#define MAXSTRLEN 255 // 用 户 可 在 255 以 内 定义 最 大 串 长 

typedef unsigned char SString [MAXSTRLEN +1];  //0 号 单元 存放 串 的 长 度 


串 的 实际 长 度 可 在 这 个 预定 义 长 度 的 范围 内 随意 设 定 ,超过 预定 义 长 度 的 串 值 则 
被 舍 去 , 称 为 “截断 ”。 按 这 种 串 的 表示 方法 实现 串 的 运算 时 ,其 基本 操作 为 “字符 序列 
的 复制 ”。 


小 结 


本 章 介绍 了 三 种 特殊 的 线性 表 : 栈 . 队 列 和 串 , 它 们 的 逻辑 结构 和 线性 表 相 同 ,其 特 
点 在 于 运算 受到 了 限制 。 

(1) 栈 是 一 种 运算 受 限 的 线性 表 , 它 只 允许 在 栈 顶 进行 插入 和 删除 等 运算 。 栈 又 称 
为 后 进 先 出 (Last In First Out) 的 线性 表 , 简 称 LIFO 结构 。 

(2) 栈 适 合 采用 顺序 存储 结构 ,通过 栈 顶 指针 能 够 访问 到 栈 顶 元 素 和 进行 插入 删除 

(3) 队列 是 一 种 运算 受 限 的 线性 表 , 它 的 运算 限制 与 栈 不 同 , 它 是 一 种 只 允许 在 一 端 
进行 插入 操作 ,而 在 另 一 端 进行 删除 操作 的 线性 表 。 队 列 是 一 种 先进 先 出 (First In First 
Out) 的 线性 表 , 简 称 FIFO。 人 允许 插入 的 一 端 称 为 队 尾 ,允许 删除 的 一 端 称 为 队 头 。 

(4) 队列 也 适合 采用 顺序 和 链 式 两 种 存储 结构 。 在 顺序 队列 中 ,存储 空间 是 首尾 相 
接 的 一 个 环 , 故 称 为 循环 队列 。 队 列 的 链 式 存储 结构 ,其实 也 就 是 线性 表 的 单 链表 ,只 不 
过 它 只 能 尾 进 头 出 而 已 ,我 们 把 它 简称 为 链 队列 。 

(5) 串 也 同样 是 线性 表 中 的 一 种 ,只 是 它 的 特殊 性 在 于 组 成 串 的 结 点 是 单个 字符 ,所 
以 存储 时 有 一 些 特殊 的 技巧 。 
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习题 


3.1 简 述 栈 和 线性 表 的 差别 。 
3.2 简 述 队列 和 栈 这 两 种 数据 结构 的 相同 点 和 异同 点 。 
3.3 串通 常 有 几 种 存储 方法 ? 
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第 4 章 数 组 


本 章 学 习 目标 
。 理解 数组 的 定义 。 
。 理解 数组 的 存储 结构 。 
。 了 解 常见 的 一 些 特殊 矩阵 : 对 称 矩 阵 和 稀 路 矩阵 。 


第 2 章 和 第 3 章 讨论 的 线性 表 中 的 数据 元 素 都 是 非 结 构 的 原子 类 型 ,元 素 的 值 是 不 
可 再 分 的 。 本 章 介绍 推广 的 线性 表 一 一 数组 , 表 中 的 数据 元 素 本 身 也 可 能 是 一 种 数据 结 
构 。 本 章 将 着 重 研究 二 维 数组 ,因为 其 应 用 相对 比较 广泛 。 


4.1 数组 的 定义 


数组 是 人 们 很 熟悉 的 一 种 数据 结构 ,可 以 看 作 一 种 特殊 的 线性 表 , 即 线性 表 中 的 数据 
元 素 本 身 也 是 一 个 线性 表 , 数 组 中 各 元 素 具有 统一 的 类 型 。 作 为 一 种 数据 结构 ,数组 的 特 
点 是 结构 中 的 元 素 本 身 可 以 是 具有 某 种 结构 的 数据 ,但 属于 同一 数据 类 型 。 例 如 ,一 维 数 
组 可 以 看 作 一 个 线性 表 , 二 维 数组 可 以 看 作 “ 数 据 元 素 是 一 维 数组 ”的 一 维 数组 。 以 此 类 
推 , 若 二 维 数组 中 的 元 素 又 是 一 个 一 维 数组 结构 , 则 称 作 三 维 数组 。 线 性 表 结 构 是 数组 结 
构 的 一 个 特例 ,而 数组 结构 又 是 线性 表 结 构 的 扩展 。 如 图 4. 1 所 示 是 一 个 mm 行 n 列 的 二 
维 数组 。 


cao ao  … ao 
mo I  … ep 
4 Po <“D0  … “Dr 
aol an . ai 
图 4.1 二 维 数组 


其 中 ,A 是 数组 结构 的 名 称 , 整 个 数组 元 素 可 以 看 成 是 由 mm 个 行 向 量 入 个 列 向 量 组 成 
的 ,其 元 素 总 数 为 mXn。 在 C 语 言 中 ,二 维 数组 中 的 数据 元 素 可 以 表示 成 a[ 表 达 式 1] 
[表达 式 2] ,表达 式 1 和 表达 式 2 被 称 为 下 标 表达 式 , 比 如 a[ 门 [j]。 数 组 结构 在 创建 时 
就 确定 了 组 成 该 结构 的 行 向 量 数目 和 列 向 量 数目 。 

抽象 数据 类 型 数组 的 定义 如 下 。 


ADT Array { 
数据 对 象 :D ={as1 1<i<m, 1<j<n} 
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数据 关系 :R = {ROW，COL} 
ROW ={<aijvrataj>11 委 运 m 1<j<n} 
co ={<assram> | SiSm, 1<j<n-1} 


基本 操作 :P= {数组 构造 操作 ,数组 赋值 操作 ,数组 销毁 操作 ,…} 


} ADT Array 


数组 上 的 基本 操作 有 以 下 几 种 。 


(1) 二 维 数组 构造 操作 : InitArray(&A, 2, bound1, bound2)。 


操作 结果 : 构造 二 维 数组 A ,并 返回 OK 。 
(2) 数组 销毁 操作 : DestroyArray(&A)。 
操作 结果 : 销毁 数组 A。 


(3) 二 维 数组 赋值 操作 : Value(A，&e, indexl, index2)。 

初始 条 件 : A 是 二 维 数组 ,e 为 元 素 变量 ,随后 是 两 个 下 标 值 。 

操作 结果 : 若 各 下 标 不 超 界 , 则 所 指定 的 A 的 元 素 值 赋 给 e ,并 返回 OK 。 

由 于 数组 一 旦 建立 ,数组 中 的 数据 元 素 个 数 和 数据 元 素 之 间 的 关系 就 不 能 再 发 生变 
化 ,所 以 数组 一 般 不 做 插入 、 删 除数 据 元 素 的 操作 。 在 数组 中 通常 做 下 面 两 种 操作 。 


(1) 取 值 操作 : 读 取 对 应 元 素 。 
(2) 赋值 操作 : 修改 对 应 元 素 。 


4.2 数组 的 存储 及 运算 实现 


从 理论 上 讲 ,数组 结构 也 可 以 使 用 两 种 存储 结构 , 即 顺序 存储 结构 和 链 式 存储 结构 。 然 
而 ,由 于 数组 结构 没有 插入 删除 元 素 的 操作 ,所 以 使 用 顺序 存储 结构 更 为 适宜 。 换 句 话说 ， 
一 般 的 数组 结构 不 使 用 链 式 存储 结构 。 组 成 数组 结构 的 元 素 可 以 是 多 维 的 ,但 存储 数据 元 
素 的 内 存单 元 地 址 是 一 维 的 ,因此 ,在 存储 数组 结构 之 前 ,需要 解决 将 多 维 关系 映射 到 一 维 
关系 的 问题 。 由 于 使 用 一 组 连续 的 存储 单元 存放 数组 的 数据 元 素 就 有 次 序 的 约定 问题 ,所 
以 对 应 地 有 两 种 顺序 映像 的 方式 : 以 行 序 为 主 序 和 以 列 序 为 主 序 , 如 图 4. 2 所 示 。 
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to0 Uo … ol 
ao hE Ql 
Mi 
Am-1.0 Gm ml 
oo ol … | ol | a a … | al nb, 0 | ml | n,m 
rr ) 
第 0 行 第 ] 行 第 m1 行 
Go0 ao Gm,0 | ao an Gm, 1 om | rl | nlm 
第 0 行 第 1 行 第 呈 1 行 


图 4.2 二 维 数组 存储 表示 


和 矩阵 是 在 很 多 科学 与 工程 计算 中 会 遇 到 的 数学 模型 。 


对 于 一 个 矩阵 结构 ,用 一 个 二 


维 数组 来 表示 是 非常 恰当 的 ,但 在 有 些 情 况 下 ,常见 到 一 些 特殊 矩阵 ,如 对 称 符 阵 和 稀 政 
符 阵 。 对 于 这 些 特 殊 算 阵 ,应 该 充分 利用 元 素 值 的 分 布 规律 ,将 其 进行 压缩 存储 ,从 而 节 
省 存储 这 些 特殊 矩阵 的 存储 空间 。 选 择 压 缩 存储 的 方法 应 遵循 两 条 原则 : 一 是 尽 可 能 地 
压缩 数据 量 , 二 是 压缩 后 仍然 可 以 比较 容易 地 进行 各 项 基本 操作 。 


1. 对 称 和 矩阵 


车 一 个 nn 阶 方 阵 A 中 的 元 素 满 足下 述 性 质 : a;j 二 aj (1 二 i<n, 1<j 过 nn ) , 则 称 A 为 
对 称 和 矩阵 。 由 于 对 称 矩 阵 中 的 元 素 关 于 主 对 角 线 对 称 , 因 此 在 存储 对 称 矩 阵 时 可 只 存储 
其 上 三 角 或 下 三 角 中 的 元 素 ,这 样 就 可 以 节约 近 一 半 的 存储 空间 。 对 称 和 矩阵 的 存储 顺序 
如 图 4. 3 所 示 。 


1 2 3 4 5 6 » 大 … mnt+1)/2 
M| a | 1] 022 | 1 | 032 033 | a | nl 人 | lm 
oe Ee SS 
第 ! 行 第 2 行 第 3 行 第 " 行 


图 4.3 nn 阶 对 称 矩 阵 的 压缩 存储 


如 图 4.4 所 示 , 有 对 称 和 矩阵 A, 可 得 按照 以 行为 主 的 顺序 将 其 压缩 存储 的 结果 。 


3 6 4 7 &8 

6 2 8 4 2 
4- 4 8 1 6 9 

A 

87 
3|16|2|14|8|1|7|4|6|0|s|2J9l5|7 


图 4.4 ”对称 矩阵 存储 示意 图 


2. 稀疏 和 矩阵 


假设 立行 2 列 的 矩阵 含 : 个 非 零 元 素 , 则 称 9 一 


0. 05 的 和 矩阵 为 稀 朴 矩阵。 

以 常规 方法 , 即 以 二 维 数组 表示 高 阶 的 稀疏 矩阵 时 会 产生 很 多 问题 : 零 值 元 素 占 了 
很 大 空间 ;计算 中 进行 了 很 多 和 零 值 相关 的 运算 , 遇 除 法 时 还 需 判 别 除数 是 否 为 零 。 为 此 
提出 另外 一 种 存储 方法 , 仅 存放 非 零 元 素 。 但 对 于 这 类 和 矩阵 ,通常 零 元 素 分 布 没 有 规律 ， 
为 了 能 找到 相应 的 元 素 , 所 以 仅 存储 非 零 元 素 的 值 是 不 够 的 ,还 要 记 下 它 所 在 的 行 和 列 。 
于 是 采用 如 下 方法 : 将 非 零 元 素 所 在 的 行 、 列 以 及 它 的 值 构 成 一 个 三 元 组 (i,j,v) ,然后 
再 按 某 种 规律 存储 这 些 三 元 组 ,这 种 方法 可 以 节约 存储 空间 。 

假设 以 顺序 存储 结构 来 表示 三 元 组 表 , 则 可 得 稀 下 和 矩阵 的 压缩 存储 方法 。 稀 朴 矩 阵 
的 三 元 组 顺序 表 存 储 表示 如 下 。 


#define MAXSIZE 100 
typedef struct { 


(为 稀疏 因子 。 通 常 认为 过 
mxXn 
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nt Ly // 该 非 零 元 素 的 行 下 标 和 列 下 标 
ElemType e; // 该 非 零 元 素 的 值 
} Triple; // 三 元 组 类 型 
typedef union { 
Triple data[MAXSIZE +1]; //data[0] 未 用 
int mu nu tu; // 行 , 列 及 非 零 个 数 
} TSMatrix; // 稀 玖 矩阵 类 型 


例如 , 稀 玻 矩阵 4 如 图 4.5 所 示 。 


0 2 9 0 00 
0 0 0 0 00 
A=| -3 0 0 0 0 14 
0 0 24 0 0 0 
0 18 0 0 0 0 


图 4.5 稀 玖 矩阵 示意 图 


下 列 三 元 组 表 ; ((152512》%5 《195.359)5 (3515 = 二 3)5 (356514)s (453524)s5. (552 
18)) ,加 上 (5,6,6)( 行 , 列 , 非 零 元 素 个 数 ) , 便 可 作为 矩阵 4 的 另 一 种 描述 。 


小 结 


本 章 介绍 了 推广 的 线性 表 一 一 数组 ,数组 的 定义 及 其 操作 ,以 及 常见 的 一 些 特 殊 矩 
阵 : 对 称 矩 阵 和 稀 朴 矩阵 。 

(1) 数组 是 存储 在 一 个 连续 的 内 存 块 中 的 元 素 集合 。 数 组 中 的 每 个 元 素 必须 是 相同 
的 数据 类 型 。 

(2) 数组 的 特点 : 数组 中 的 每 个 元 素 是 同一 类 型 元 素 ; 思 连 续 的 内 存 地 址 空间 ; 
@ 数 组 大 小 一 旦 确定 不 可 更 改 。 

(3) 数组 分 为 一 组 数组 二 维 数组 和 多 维 数组 。 

(4) 数组 一 般 不 做 插入 、 删 除数 据 元 素 的 操作 。 

(5) 数组 的 基本 操作 主要 是 元 素 的 读 取 和 更 新 。 

(6) 数组 也 可 以 使 用 两 种 存储 结构 , 即 顺序 存储 结构 和 链 式 存储 结构 。 由 于 数组 没 
有 择 入、 删除 元 素 的 操作 ,所 以 使 用 顺序 存储 结构 更 为 适宜 。 

(7) 数组 的 存储 方式 有 两 种 : 以 行 序 为 主 序 和 以 列 序 为 主 序 的 映像 方式 。 

(8) 常见 的 特殊 矩阵 有 对 称 和 矩阵 和 稀 朴 矩阵 。 对 于 这 些 特殊 矩阵 ,应 充分 利用 元 素 
值 的 分 布 规律 ,将 其 进行 压缩 存储 ,从 而 节省 存储 这 些 特 殊 和 矩阵 的 存储 空间 。 

(9) 选择 压缩 存储 的 方法 应 遵循 两 条 原则 : 一 是 尽 可 能 地 压缩 数据 量 , 二 是 压缩 后 
仍然 可 以 比较 容易 地 进行 各 项 基本 操作 。 


习题 


4.1 简 述 数组 和 一 般 线性 表 的 差别 。 
4.2 简 述 对 称 矩 阵 和 稀疏 矩阵 这 两 种 特殊 矩阵 的 存储 方式 。 
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第 5 章 ” 树 与 二 又 树 


本 章 学 习 目标 
。 掌握 树 的 定义 及 相关 术语 。 
。 理解 二 又 树 的 定义 及 性 质 。 
。 了 解 二 又 树 的 存储 结构 。 
。 掌握 二 又 树 遍 历 的 基本 方法 。 


本 章 介绍 的 树 状 结构 是 一 类 重要 的 非 线 性 结构 ,也 是 一 种 分 层 结构 ,其 中 以 二 又 树 最 
为 常用 。 因 为 在 实际 应 用 中 ,对 于 给 定 的 问题 ,许多 是 能 够 抽取 层级 模型 的 ,而 树 和 二 又 


树 是 处 理 层 次 模型 的 典型 结构 。 因 此 ,我们 研究 树 和 二 又 树 的 存储 与 应 用 是 非常 有 实际 
意义 的 。 


5.1 树 


5.1.1 树 的 定义 


树 是 一 种 简单 的 非 线 性 结构 。 在 树 这 种 数据 结构 中 ,所 有 数据 元 素 之 间 的 关系 具有 
明显 的 层次 特性 。 图 5. 1 表示 了 一 棵 一 般 的 树 。 由 


4 
图 5.1 可 以 看 出 ,在 用 图 形 表示 树 这 种 数据 结构 时 ,很 像 | 
自然 界 中 的 树 ,只 不 过 是 一 棵 倒 长 的 树 ,因此 ,这 种 数据 


结构 就 用 * 树 ”来 命名 。 

在 树 的 图 形 表示 中 ,总 是 认为 在 用 直线 连 起 来 的 两 Ze Pan 
端 结 点 中 ,上 端 结 点 是 前 驱 , 下 端 结 点 是 后 继 。 这 样 表示 六 
前 后 继 关系 的 箭头 就 可 以 省 略 。 1 >Y 

树 (Tree) 是 n(n 宇 0) 个 有 限 数 据 元 素 的 集合 。 当 图 5.1 一 般 的 树 


n 二 0 时 , 称 这 棵 树 是 空 树 。 在 一 棵 非 空 树 工 中 : 

(1) 有 一 个 特殊 的 数据 元 素 称 为 树 的 根 结 点 , 根 结 点 没有 前 驱 结 点 。 

(2) 当 ?>1 时 ,除根 结 点 之 外 的 其 余数 据 元 素 被 分 为 m(m 二 0) 个 互 不 相交 的 集合 
TT ,Ts,…,T。 ,其 中 每 一 个 集合 T;(1<i<m) 本 身 又 是 一 棵 树 。 树 TT,T,…,T。 称 为 这 
个 根 结 点 的 子 树 。 

从 树 的 定义 可 以 看 出 , 树 具有 下 面 两 个 特点 。 

(1) 树 的 根 结 点 没有 前 驱 结 点 ,除根 结 点 之 外 的 所 有 结 点 有 且 只 有 一 个 前 驱 结 点 。 

(2) 树 中 所 有 结 点 可 以 有 零 个 或 多 个 后 继 结 点 。 
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在 现实 世界 中 ,能 用 树 这 种 数据 结构 表示 的 例子 有 很 多 。 例 如 ,图 5.2 中 的 树 表示 了 


管理 学 院 学 校 行政 关系 结构 。 由 于 树 具有 明显 的 层次 关系 ， 
因此 , 树 与 二 叉 树 都 可 以 用 树 这 种 数据 结构 来 描述 。 
在 所 有 的 层次 关系 中 ,人 们 最 熟悉 的 是 血缘 关系 , 按 
信息 管理 “工商 管理 血缘 关系 可 以 很 直观 地 理解 树 结构 中 各 数据 元 素 结 
7 点 之 间 的 关系 ,因此 ,在 描述 树 结构 时 ,也 经 常 使 用 
管理 信息 系统 电子 商务 oe 血缘 关系 中 的 一 些 术 语 。 
图 5.2 学 校 行政 层次 结构 树 抽象 数据 类 型 树 的 定义 如 下 。 


ADT Tree { 
数据 对 象 0:D 是 具有 相同 特性 的 数据 元 素 的 集合 。 
数据 关系 R: 若 D 为 空 集 , 则 称 为 空 树 。 否 则 : 
(1) 在 D 中 存在 唯一 的 称 为 根 的 数据 元 素 root; 
(2) 当 n>1 时 ,其 余 结 点 可 分 为 m (m> 0) 个 互 不 相交 的 有 限 集 LT ，…，T, 其 中 每 一 
个 子 集 本 身 又 是 一 棵 符合 本 定义 的 树 , 称 为 根 root 的 子 树 。 
基本 操作 :P= {初始 化 树 , 销 毁 树 ,插入 树 , 删 除 树 ,…} 


} ADT Tree 
树 的 基本 操作 有 以 下 几 种 。 
(1) 初始 化 操作 : InitTree (&T) 。 
初始 条 件 : 树 工 不 存在 。 
操作 结果 : 构造 空 树 T。 
(2) 销毁 操作 : DestroyTree (&T)。 
初始 条 件 : 树 工 存在 。 
操作 结果 : 销毁 树 工 。 
(3) 插入 树 操 作 : InsertChild(&T, &p, i, c)。 
初始 条 件 : 树 工 存在 。 
操作 结果 : 将 以 c 为 根 的 树 插入 为 结 点 p 的 第 i 棵 子 树 。 
(4) 删除 树 操作 : DeleteChild(&T,，&p, 7)。 
初始 条 件 : 树 工 存在 。 
操作 结果 : 删除 结 点 p 的 第 i 棵 子 树 。 


5.1.2 相关 术语 


下 面 介绍 树 这 种 数据 结构 中 的 一 些 基本 术语 。 

(1) 根 结 点 : 在 树 结构 中 ,每 一 个 结 点 只 有 一 个 前 驱 , 称 为 父 结 点 ,没有 前 驱 的 结 点 
只 有 一 个 , 称 为 树 的 根 结 点 ,简称 为 树 的 根 。 例 如 ,在 图 5. 1 中 , 结 点 A 是 树 的 根 结 点 。 

(2) 叶子 结 点 : 在 树 结构 中 ,每 一 个 结 点 可 以 有 多 个 后 继 ,它们 都 称 为 该 结 点 的 子 结 
点 。 没 有 后 继 的 结 点 称 为 叶子 结 点 。 例 如 ,在 图 5. 1 中 , 结 点 CE、G、 甩 、T、J 均 为 叶子 
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(3) 度 : 在 树 结构 中 ,一 个 结 点 所 拥有 的 后 继 个 数 称 为 该 结 点 的 度 。 例 如 ,在 图 5.1 
中 , 根 结 点 A 的 度 为 a B 的 度 为 2; 叶 子 结 点 的 度 为 0。 在 树 中 ,所 有 结 点 中 的 最 大 
的 度 称 为 树 的 度 。 例 如 ,图 5. 1 所 示 的 树 的 度 为 3。 前面 已 经 说 过 , 树 结构 具有 明显 的 层 
次 关系 , 即 树 是 一 种 层次 结构 。 在 树 结构 中 ,一般 按 如 下 原则 分 层 : 根 结 点 在 第 1 
epee er ae 层 。 例 如 ,在 图 5.1 中 , 根 结 点 A 在 第 1 层 ; 结 

C.D 在 第 2 层 ; 结 点 EF.F.G、H 在 第 3 层 ; 结 点 1、J 在 第 4 层 。 竺 的 最 大 层次 称 为 本 
Pin 例如 ,如 图 5. 1 所 示 的 树 的 深度 为 4。 

(4) 孩子 双亲、 兄弟 : 在 树 中 ,以 某 结 点 的 一 个 子 结 点 为 根 构成 的 树 称 为 该 结 点 的 
一 棵 子 树 。 树 中 某 个 结 点 的 子 树 之 根 称 为 该 结 点 的 孩子 ,相应 地 ,该 结 点 称 为 孩子 的 双亲 
或 父亲 。 例 如 ,在 图 5. 1 中 , 结 点 B.C.D 是 A 的 孩子 ;A 是 B 结 点 的 双亲 。 同 一 个 双亲 
的 孩子 称 为 兄弟 ,E、F 是 兄弟 ,B.C、D 是 兄弟 。 

(5) 有 序 树 和 无 序 树 : 如 果 一 棵 树 中 结 点 的 各 子 树 之 间 存 在 确定 的 次 序 关系 , 称 这 
棵 树 为 有 序 树 ;反之 , 则 称 为 无 序 树 。 


5.2 ”二叉树 


二 叉 树 是 树 状 结构 的 另 一 个 重要 类 型 ,许多 实际 问题 抽象 出 来 的 数据 结构 往往 是 二 
叉 树 的 形式 ,即使 是 一 般 的 树 也 能 简单 地 转换 成 二 叉 树 。 二 叉 树 的 结构 规律 性 强 , 其 存储 
结构 及 其 算法 都 较为 简单 ,因此 ,二 又 树 特别 重要 。 


5.2.1 二 叉 树 的 定义 


二 叉 树 (Binary Tree) 是 一 种 很 有 用 的 非 线 性 结构 , 它 是 n(n 三 0) 个 结 点 的 有 限 集合 ， 
它 或 者 是 空 集 (n 二 0) ,或 者 由 一 个 根 结 点 及 两 棵 互 不 相交 的 、 分 别称 为 这 个 根 的 左 子 树 
和 右 子 树 的 二 叉 树 组 成 。 

二 叉 树 具有 以 下 两 个 特点 。 

(1) 非 空 二 叉 树 只 有 一 个 根 结 点 ; 

(2) 每 一 个 结 点 最 多 有 两 棵 子 树 , 且 分 别称 为 该 结 点 的 左 子 树 与 右 子 树 。 

由 以 上 特点 可 以 看 出 ,在 二 又 树 中 ,每 一 个 结 点 的 度 


最 大 为 2， 即 所 有 子 桂 ( 左 子 树 或 子 树 ) 也 均 为 二 又 和， 有 
而 树 结构 中 的 每 一 个 结 点 的 度 可 以 是 任意 的 。 另 外 ,二 


又 树 中 的 每 一 a ee 2 2 
树 。 在 二 叉 树 中 ,一 个 结 点 可 以 只 有 左 子 树 而 没有 右 子 

村 ,也 可 以 具有 右 子 树 而 没有 左 子 桂 。 当 一 个 结 点 版 没 A 

有 左 子 树 也 没有 右 子 树 时 ,该 结 点 即 是 叶子 结 点 。 如 


图 5. 3 所 示 是 一 棵 深度 为 4 的 二 叉 树 。 图 5.3 二 叉 桂 
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5.2.2 二 叉 树 的 性 质 


二 叉 树 具有 下 列 重要 特性 。 

性 质 1 在 二 又 树 的 第 & 层 上 ,最 多 有 2 所 :个 结 点 。 

根据 二 叉 树 的 特点 ,这 个 性 质 是 显然 的 。 

性 质 2 深度 为 k 的 二 叉 树 最 多 有 2* 一 1 个 结 点 。 

深度 为 k 的 二 叉 树 是 指 二 叉 树 共有 k 层 。 根 据 性 质 1, 只 要 将 第 1 层 到 第 上 层 上 的 最 
大 的 结 点 数 相 加 ,就 可 以 得 到 整个 二 叉 树 中 结 点 数 的 最 大 值 , 即 

1 十 2 十 22 十 … 十 2 一 2 一 1 

一 棵 深度 为 k 且 有 2: 一 1 个 结 点 的 二 叉 树 称 为 满 二 叉 树 。 完 全 二 又 树 是 由 满 二 又 树 
而 引出 来 的 。 对 于 深度 为 &, 有 个 结 点 的 二 又 树 , 当 且 仅 当 其 每 一 个 结 点 都 与 深度 为 
的 满 二 又 树 中 编号 从 1 至 的 结 点 一 一 对 应 时 称 为 完全 二 叉 树 。 即 除 第 k 层 外 ,其 他 各 
层 (1 一 4 一 1) 的 结 点 数 都 达到 最 大 个 数 , 第 & 层 所 有 的 结 点 都 连续 集中 在 最 左边 ,这 就 是 
完全 二 又 树 。 

性 质 3 在 任意 一 棵 二 叉 树 中 , 度 为 0 的 结 点 ( 即 叶子 结 点 ) 总 是 比 度 为 2 的 结 点 多 
三 个 ; 凤 

no 二 nz 十 1 

对 于 这 个 性 质 说 明 如 下 : 假设 二 叉 树 中 有 no 个 叶子 结 点 ,ni 个 度 为 1 的 结 点 ,za 个 

度 为 2 的 结 点 , 则 二 叉 树 中 总 的 结 点 数 为 
n= 二 no 十 1 十 nz (5-1) 

在 二 叉 树 中 除了 根 结 点 外 ,其 余 每 一 个 结 点 都 有 唯一 的 一 个 分 支 进 入 。 设 二 叉 树 中 
所 有 进入 分 支 的 总 数 为 m, 则 二 叉 树 中 总 的 结 点 数 为 ,除了 根 结 点 ,其 余 结 点 都 有 一 个 
分 支 进 入 , 即 n==m 十 1。 

又 由 于 二 叉 树 中 这 m 个 进入 分 支 是 分 别 由 非 叶 子 结 点 射出 的 ,其 中 度 为 1 的 每 个 结 
点 射出 一 个 分 支 , 度 为 2 的 每 个 结 点 射出 两 个 分 支 , 因 此 ,二 叉 树 中 所 有 度 为 1 与 度 为 2 
的 结 点 射出 的 分 支 总 数 为 nn 十 2n;。 而 在 二 叉 树 中 ,总 的 射出 分 支 数 应 与 总 的 进入 分 支 
数 相等 , 即 m= 二 nm 十 2ns ,于 是 得 

n 二 m1 十 2nz 十 1 (5-2) 
最 后 比较 式 (5-1) 和 式 (5-2) ,有 
zxo 十 mn 十 ?zz 二 十 2nz 十 1 

化 简 后 得 6 二 nz 十 1。 

即 ,在 二 又 树 中 , 度 为 0 的 结 点 ( 即 叶 子 结 点 ) 总 是 比 度 为 2 的 结 点 多 一 个 。 

性 质 4 具有 个 结 点 的 完全 二 叉 树 的 深度 为 [logzn | 十 1。 

证 明 : 设 完全 二 又 树 的 深度 为 k, 则 根据 性 质 2 得 2 <n<2*, 即 一 1<logsn<<k， 
因为 只 能 是 整数 ,因此 ,k=[logzn | 十 1。 

性 质 5 若 对 含 个 结 点 的 完全 二 叉 树 从 上 到 下 且 从 左 至 右 进行 1~n 的 编号 , 则 对 
完全 二 又 树 中 任意 一 个 编号 为 i 的 结 点 ,有 : 
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(1) 若 ;一 1, 则 该 结 点 是 二 又 树 的 根 ,无 双亲 ;否则 ,其 双亲 结 点 编号 为 Li/2 上 ,其 左 孩 
子 结 点 编号 为 2i, 右 孩子 结 点 编号 为 2i 十 1。 

(2) 若 2 二 2, 则 该 结 点 无 左 孩子 。 

(3) 若 2 十 1>2, 则 该 结 点 无 右 孩 子 。 


5.2.3 二 叉 树 的 存储 结构 


二 叉 树 也 可 以 采用 两 种 存储 方式 : 顺序 存储 结构 和 链 式 存储 结构 。 


二 叉 树 的 顺序 存储 表示 可 描述 为 ， 
#define MAX TREE SIZE 100 // 二 叉 树 的 最 大 结 点 数 
typede TElemType SqBiTree[MAX TREE SIZE]; //0 号 单元 通常 不 用 


SqBiTree bt; 

这 种 存储 结构 适用 于 完全 二 叉 树 。 其 存储 形式 用 一 组 连续 的 存储 单元 按照 完全 二 叉 
树 的 每 个 结 点 “ 自 上 而 下 .从 左 至 右 ” 编 号 的 顺序 存放 结 点 内 容 。 一 棵 完全 二 又 树 ( 满 二 又 
树 ) 如 图 5.4 所 示 。 

将 这 棵 二 叉 树 存 到 数组 中 ,相应 的 下 标 对 应 其 同样 的 位 置 ,如 图 5.5 所 示 。 


| 


J 
四 可 四 四 加 


图 5.5 完全 二 叉 树 的 顺序 存储 示意 图 


根据 二 叉 树 的 性 质 5, 完 全 二 又 树 和 满 二 又 树 采取 顺序 存储 方式 , 树 中 结 点 的 序号 可 
以 唯一 地 反映 出 结 点 之 间 的 逻辑 关系 , 即 可 以 做 到 唯一 复原 二 叉 树 。 对 于 一 般 二 叉 树 ,只 
有 将 各 层 空 缺 处 统统 补 上 “ 虚 结 点 ”, 其 内 容 为 空 , 才 能 将 其 改造 成 一 棵 完全 二 叉 树 。 若 空 
缺 结 点 较 多 ,势必 造成 空间 利用 率 的 下 降 , 使 树 的 插入 、 删 除 不 便 。 在 这 种 情况 下 ,就 应 该 
考虑 使 用 链 式 存储 结构 。 

二 又 树 的 链 式 存储 结构 中 最 常用 的 是 二 又 链表 和 三 又 链表。 二 又 链表 的 每 个 结 点 有 一 
个 数据 域 和 两 个 指针 域 ,一 个 指针 指向 左 孩 子 , 男 一 个 指针 指向 右 孩 子 。 常 见 的 二 叉 树 结 点 
结构 及 存储 结构 描述 如 图 5. 6 所 示 ,二 又 链表 具有 不 浪费 空间 ,插入 、 删 除 方便 等 特点 。 

其 中 ,lchild 和 rchild 是 分 别 指向 该 结 点 左 孩 子 和 右 孩 子 的 指针 ,data 是 数据 元 素 的 
内 容 。 二 又 树 的 链 式 存储 表示 可 描述 为 ; 

typedef struct BiTNode { // 结 点 结构 


TElemType data; 
struct BiTNode *1lchild, *rchild; // 左 右 孩 子 指针 
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} BiTNode, * BiTree; 


CT rchild 
Toot 
A 
中 和 应 
@ 全 ) AcI EI 
(F) REN 


图 5.6 二 又 链表 的 存储 结构 


这 种 存储 结构 的 特点 是 寻找 孩子 结 点 容易 ,寻找 双亲 结 点 比较 困难 。 因 此 , 若 需要 频 
繁 地 寻找 双亲 结 点 ,可 以 给 每 个 结 点 添加 一 个 指向 双亲 结 点 的 指针 域 , 便 可 以 采用 三 叉 链 
表 的 形式 ,其 结 点 结构 及 存储 结构 描述 如 图 5. 7 所 示 。 


结 点 结构 ， [Parent | enid | daa | rnid | 


图 5.7 三 叉 链表 的 存储 结构 


其 中 ,data 是 数据 域 ,parent lchild 和 rchild 都 是 指针 域 ,分 别 存放 指向 双亲 、 左 孩子 
和 右 孩 子 的 指针 。 


s.3 ”二叉树 的 遍历 


遍历 指 按 某 条 搜索 路 线 遍 访 每 个 结 点 且 不 重复 (又 称 周游 )。 它 是 树 结构 插入、 删除 、 修 
改 , 查 找 和 排序 运算 的 前 提 , 是 二 又 树 一 切 运算 的 基础 和 核心 。 二 又 树 是 一 种 非 线性 的 数据 结 
构 , 在 对 它 进 行 操作 时 ,总 是 需要 逐一 对 每 个 数据 元 素 实施 操作 ,这 样 就 存在 一 个 操作 顺序 问 
题 。 由 二 又 树 的 递归 定义 可 知 , 二 又 树 是 由 三 个 基本 单元 组 成 : 根 结 点 、 左 子 树 和 右 子 树 。 由 
此 提出 了 三 种 二 叉 树 遍历 的 搜索 路 径 : 先 ( 根 ) 序 遍历 ,中 ( 根 ) 序 遍历 ,后 ( 根 ) 序 遍历 。 


1. 先 序 遍历 算法 的 递归 描述 
先 序 遍历 的 递归 过 程 为 : 车 二 又 树 为 空 树 , 则 遍历 结束 ;否则 ， 
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(1) 访问 根 结 点 ; 
(2) 先 序 遍历 根 结 点 的 左 子 树 ; 
(3) 先 序 遍历 根 结 点 的 右 子 树 。 


二 叉 树 先 序 遍 历 算法 的 递归 描述 为 : 

void Preorder (BiTree T, void( *visit) (TElemTypeé& e)) 

{ AF (rT) 
visit (T->data); // 访 问 结 点 
Preorder (T->1lchild, visit); // 遍 历 左 子 树 
Preorder (T->rchild, visit); // 遍 历 右 子 树 


} 


2. 中 序 遍 历 算法 的 递归 描述 


中 序 遍 历 的 递归 过 程 为 : 若 二 又 树 为 空 树 , 则 遍历 结束 ;否则 ， 
(1) 中 序 遍 历 根 结 点 的 左 子 树 ， 

(2) 访问 根 结 点 

(3) 中 序 遍 历 根 结 点 的 右 子 树 。 

二 叉 树 中 序 遍 历 算法 的 递归 描述 为 : 


void Inorder (BiTree T) 


{ 


a 
Inorder (T->1child); // 饥 历 左 子 树 
printf (T->data); // 访 问 结 点 
Inorder (T->rchild); // 遍 历 右 子 树 


} 


3. 后 序 遍 历 算法 的 递归 描述 


后 序 遍 历 的 递归 过 程 为 : 若 二 叉 树 为 空 树 , 则 遍历 结束 ;否则 ， 
(1) 后 序 遍 历 根 结 点 的 左 子 树 ; 

(2) 后 序 遍 历 根 结 点 的 右 子 树 ; 

(3) 访问 根 结 点 。 

二 又 树 后 序 遍 历 算法 的 递归 描述 为 ， 


void Postorder (BiTree T) 


{ 


if (T) { 
Postorder (T->1lchild); // 遍 历 左 子 树 
Postorder (T->rchild); // 遍 历 右 子 树 
printf (T->data); // 访 问 结 点 


树 与 二 叉 树 
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可 见 , 遍 历 二叉树 的 算法 中 的 基本 操作 是 访问 结 点 ,不论 按 哪 一 种 次 序 进行 遍历 ,对 
含 nn 个 结 点 的 二 又 树 ,其 时 间 复 杂 度 均 为 0(n) 。 


小 结 


本 章 主要 介绍 树 、 二 叉 树 的 概念 及 遍历 方法 等 。 

(1) 树 是 一 种 非 线 性 的 数据 结构 ,是 若干 结 点 的 集合 ,由 唯一 的 根 结 点 和 若干 棵 互 不 
相交 的 子 树 构成 。 其 中 每 一 棵 子 树 又 是 一 棵 树 ,也 是 由 唯一 的 根 结 点 和 若干 棵 互 不 相交 
的 子 树 组 成 的 ,由 此 可 知 : 树 的 定义 是 递归 的 。 树 的 结 点 数目 可 以 为 0, 为 0 的 时 候 是 一 
棵 空 树 。 

(2) 树 是 一 种 层次 数据 结构 ,第 一 层 只 有 一 个 结 点 , 称 为 树 根 结 点 ,其 后 每 一 层 都 是 
上 一 层 相 应 结 点 的 后 继 结 点 。 每 个 结 点 可 以 有 任意 多 个 后 继 结 点 ,但 除 树 根 结 点 外 ,每 个 
结 点 有 并 且 只 能 有 一 个 前 驱 结 点 。 树 中 结 点 的 前 驱 结 点 称 为 该 结 点 的 父亲 或 双亲 ,后 继 
结 点 称 为 该 结 点 的 孩子 。 

(3) 二 又 树 是 一 种 特殊 的 树 状 结构 , 它 的 特点 是 每 个 结 点 最 多 只 有 两 棵 子 树 ,并 且 二 
又 树 的 子 树 有 左右 之 分 ,其 次 序 不 能 任意 颠倒 。 

(4) 二 又 树 的 存储 结构 分 为 顺序 存储 结构 和 链 式 存储 结构 两 种 。 顺 序 存 储 最 适合 于 
完全 二 又 树 ,使 用 顺序 存储 结构 要 从 数组 下 标 为 1 开始 。 

(5) 二 又 树 的 遍历 是 指 按 一 定 的 规则 和 次 序 访问 树 中 的 每 个 结 点 , 且 每 个 结 点 只 能 
被 访问 一 次 。 它 包括 先 序 、 中 序 、 后 序 三 种 不 同 的 遍历 次 序 。 


习题 


5.1 写 出 如 图 5.8 所 示 的 树 的 叶子 结 点 、 非 叶子 结 点 、 各 结 点 的 度 和 树 深 。 
5.2 已 知 一 棵 二 又 树 如 图 5. 9 所 示 ,给 出 树 的 先 序 遍 历 序列 .中 序 遍 历 序列 和 后 序 


遍历 序列 。 
(2) ® 
DW QA @ 
回 过 
OOIOIOIOIO 
GONO 
@ @ 


图 5.8 一 般 树 的 示例 图 5.9 二 叉 树 的 示例 


50 


本 章 学 习 目标 
。 掌握 图 的 定义 及 相关 术语 。 
。 了 解 图 的 存储 结构 。 
。 理解 图 的 遍历 的 基本 方法 。 


本 章 介绍 的 图 是 一 种 较 线性 表 和 树 更 为 复杂 的 数据 结构 。 线 性 表 反 映 的 是 数据 元 素 
之 间 的 一 对 一 的 相 邻 关系 , 树 反映 的 是 数据 元 素 之 间 的 一 对 多 的 层次 关系 ,而 图 反映 的 是 
数据 元 素 之 间 的 多 对 多 的 网 状 关系 。 图 结构 可 以 描述 各 种 复杂 的 数据 对 象 ,因此 图 的 应 
用 极为 广泛 ,已 渗入 到 诸如 语言 学 逻辑 学 物理, 化学、 电信 工程 .计算 机 科学 以 及 数学 的 
其 他 分 支 中 。 图 在 现实 世界 中 应 用 较为 广泛 ,比如 ,城市 交通 网 .通信 网 .客户 之 间 的 供求 
关系 网 等 。 在 本 章 中 将 详细 介绍 图 的 存储 表示 及 其 基本 操作 的 实现 。 


6.1 图 的 定义 和 术语 


图 是 一 种 比 线性 表 和 树 更 加 复杂 的 数据 结构 。 线 性 表 和 树 可 以 看 成 是 两 种 特殊 的 
图 。 线 性 表 中 ,数据 元 素 之 间 呈 现 一 种 线性 关系 , 即 每 个 元 素 只 有 一 个 直接 前 驱 和 一 
个 直接 后 继 ; 树 结构 中 , 结 点 之 间 是 一 种 层次 关系 , 即 每 个 结 点 只 有 一 个 直接 前 驱 , 但 
可 有 多 个 直接 后 继 ; 图 结构 中 ,每 个 结 点 既 可 以 有 多 个 直接 前 驱 , 也 可 以 有 多 个 直接 
后 继 。 

图 是 n(n 宇 0) 个 元 素 的 有 限 集 。 图 可 以 表示 成 二 元 组 的 形式 , 即 

Graph = (V,E) 

其 中 ,V 是 图 中 数据 元 素 的 集合 ,通常 称 为 项 点 集 ;E 是 数据 元 素 之 间 关 系 的 集合 ,通常 称 
为 边 集 。 

抽象 数据 类 型 图 的 定义 如 下 。 


ADT Graph { 
数据 对 象 Vv:V 是 具有 相同 特性 的 数据 元 素 的 集合 , 称 为 项 点 集 。 
数据 关系 R: 
R= {VR} 
VR={<vViw> 1viwEV 且 Pl(vViw),，<vViw> 表 示 从 vV 到 w 的 弧 ， 
谓词 P(v,w) 定 义 了 弧 <vw> 的 意义 或 信息 } 
基本 操作 :P={ 初 始 化 图 ,销毁 图 ,插入 图 顶点 ,… } 
} ADT Graph 


图 是 由 V 和 VR 构成 的 数据 结构 。 图 的 基本 操作 有 以 下 几 种 。 
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(1) 初始 化 操作 : CreatGraph(&G, V, VR)。 
初始 条 件 : 图 G 不 存在 。 
操作 结果 : 按 定义 (V,，VR) 构 造 图 。 
(2) 销毁 操作 DestroyGraph(&G) 。 
初始 条 件 : 图 G 存在 。 
操作 结果 : 销毁 图 C。 
(3) 插入 图 顶点 操作 : InsertVex(&G, v)。 
初始 条 件 : 图 G 存在 ,v 和 图 中 顶点 有 相同 特征 。 
操作 结果 : 在 图 G 中 增添 新 顶点 v。 
(4) 增添 弧 操 作 : InsertArc(&G, v, tw)。 
初始 条 件 : 图 G 存在 ,v 和 w 是 G 的 两 个 顶点 。 
操作 结果 : 在 G 中 增添 弧 <u,zo> , 若 G 是 无 向 的 , 则 还 增添 对 称 弧 二 wv 之 。 
(5) 删除 弧 操 作 : DeleteArc(&G, v, w)。 
初始 条 件 : 图 G 存 在,v 和 w 是 G 的 两 个 顶点 。 
操作 结果 : 在 G 中 删除 弧 王 wzo>, 若 G 是 无 向 的 , 则 还 删除 对 称 弧 <zu,v>> 。 
图 的 相关 术语 如 下 。 
有 向 图 : 由 于 * 弧 ”是 有 方向 的 ,因此 顶点 对 过 w, zw 之 是 有 序 的 。 由 顶点 集 和 弧 集 构 


成 的 图 称 为 有 向 图 。 


无 向 图 : 若 达 v, weVR 必 有 二 zw,u>>eVR , 则 称 (v,w) 为 顶点 v 和 顶点 w 之 间 存 


在 一 条 边 。 由 项 点 集 和 边 集 构成 的 图 称 作 无 向 图 。 

权 : 与 图 的 边 或 弧 相 关 的 数 称 为 权 。 

网 : 带 权 的 图 称 作 网 。 弧 带 权 的 图 称 作 有 向 网 , 边 带 权 的 图 称 作 无 向 网 。 

子 图 : 如 果 图 G==(V,{VR})) 和 图 G ==(V',{VR'}) 满足 VSV 且 VR’'SVR, 则 称 
G 为 G 的 子 图 。 

无 向 完全 图 : :个 顶点 的 无 向 图 ,如 含有 xz(z 一 1)/2 条 边 , 则 称 为 无 向 完全 图 。 

有 向 完全 图 : ， 个 顶点 的 有 向 图 , 若 含 有 2(2z 一 1) 条 弧 , 则 称 为 有 向 完全 图 。 

稀疏 图 、 稠 密 图 : 若 边 或 弧 的 个 数 e 一 xlogz , 则 称 为 稀 朴 图 ,否则 称 为 稠密 图 。 

关联 : 边 (v,w) 或 弧 (v,w) 与 顶点 v 和 w 相关 联 。 

邻接 点 : 在 无 向 图 中 若 存 在 边 (v,w) , 则 称 顶点 v 和 ww 互 为 邻接 点 。 

顶点 的 度 : 与 顶点 v 相关 联 的 边 的 条 数 , 记 作 TD(w)。 

顶点 的 入 度 : 以 v 为 终点 的 有 向 边 的 条 数 , 记 作 ID(v)。 

顶点 的 出 度 : 以 v 为 始点 的 有 向 边 的 条 数 , 记 作 OD(v)。 

路 径 : 设 图 G 二 (V, {VR)) 中 ,车 从 顶点 v; 出 发 , 沿 一 些 边 经 过 一 些 顶点 到 达 顶 点 
vj， 则 称 所 经 过 的 边 和 顶点 为 从 顶点 vi; 到 顶点 wv 的 路 径 。 它 经 过 的 边 应 属于 {VR}, 它 经 
过 的 顶点 应 属于 V。 

路 径 长 度 : 图 的 路 径 长 度 是 指 此 路 径 上 边 的 条 数 ,网 的 路 径 长 度 是 指 路 径 上 各 边 的 
权 之 和 。 
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简单 路 径 : 序列 中 顶点 不 重复 出 现 的 路 径 。 


简单 回路 : 序列 中 第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 。 

连通 图 : 若 无 向 图 G 中 任意 两 个 顶点 之 间 都 有 路 径 相通 , 则 称 此 图 为 连通 图 。 

连通 分 量 : 若 无 向 图 为 非 连通 图 , 则 图 中 各 个 极 大 连通 子 图 称 作 此 图 的 连通 分 量 。 

强 连通 图 : 对 于 有 向 图 , 若 任意 两 个 顶点 之 间 都 存在 一 条 有 向 路 径 , 则 称 此 有 向 图 为 
强 连通 图 。 

强 连通 分 量 : 对 于 有 向 图 ,若非 强 连通 图 ,其 各 个 极 大 强 连 通 子 图 称 作 它 的 强 连通 
分 量 。 

生成 树 : 假设 一 个 连通 图 及 个 顶点 和 e 条 边 , 其 中 ,n 一 1 条 边 和 个 顶点 构成 一 个 
极 小 连通 子 图 , 称 该 极 小 连通 子 图 为 此 连通 图 的 生成 树 。 


6.2 图 的 存储 表示 


图 是 一 种 结构 复杂 的 数据 结构 ,表现 在 不 仅 各 个 顶点 的 度 可 以 千差万别 ,而 且 顶 点 之 
间 的 逻辑 关系 也 错综复杂 。 因 此 无 论 采 用 什么 方法 建立 图 的 存储 结构 ,都 要 完整 ,准确 地 
反映 这 两 方面 的 信息 。 

下 面 介绍 几 种 常用 图 的 存储 结构 。 


1. 图 的 数组 (邻接 矩阵 ) 存 储 表示 


图 的 邻接 矩阵 表示 法 是 用 一 个 一 维 数组 来 存放 项 点 的 信息 ,再 用 一 个 二 维 数组 来 存 
放 边 或 弧 的 信息 的 表示 方法 ,又 称 为 数组 表示 法 。 常 采用 矩阵 的 形式 来 描述 边 或 弧 的 信 
息 。 邻 接 矩 阵 的 类 型 定义 如 下 。 


#define INFINITY INT MAX // 最 大 值 == 
#define MAX VER NUM 20 // 最 大 顶点 个 数 
typedef enum {DG, DN, UDG, UDN} GraphKind; 
// 类 型 标志 {有 向 图 ,有 向 网 ,无 向 图 ,无 向 网 } 


typedef struct ArcCell { // 弧 的 定义 
VRTYpe adj; // 顶 点 关系 类 型 
InfoType * info; // 该 弧 相关 信息 的 指针 
} ArcCell, AdjMatrix [MAX VER NUM] [MAX VER NUM]; 
typedef struct { // 图 的 定义 
VertexType vexs [MAX VER NUM]; // 顶 点 信息 
AdjMatrix arcs; // 弧 的 信息 
int vexnum, arcnum; // 顶 点 数 , 弧 数 
GraphKind kind; // 图 的 种 类 标志 
} MGraph; 
设 无 向 图 G 二 (V,E) 有 个 顶点 ,顶点 序号 依次 为 0,1,…,n 一 1, 用 一 维 数组 存储 nn 
个 顶点 的 信息 ,用 半 阶 的 方 阵 存储 顶点 之 间 的 边 。 假 设 该 矩阵 的 名 称 为 A, 则 当 (wvi ,wv;) 


是 该 无 向 图 中 的 一 条 边 时 ,A[i, 门 ==A[Lj, 习 ==1; 否 则 ,A[i, 让 二 AL[j, 门 =0。 定 义 一 个 大 
小 为 nn 的 一 维 数组 a[nj 存 储 项 点 信息 。G 的 二 维 邻 接 和 矩阵 可 定义 为 ， 
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A,= 


站 


0, (Gi, EVR 
村 (i EVR 
若 G 是 网 , 则 其 邻接 矩阵 可 定义 为 : 
F 车 ij 且 <i,j 之 EE 或 (i, 站 EE 
A,= 


co， 车 i 了 ij 且 <i,j KE 或 (i,)) EE 

05 车 i==j 

这 里 ,Ws 表示 边 上 的 权 值 ;eo 代表 一 个 计算 机 允许 的 、 大 于 所 有 边 上 权 值 的 正 整 数 。 
无 向 图 G, 用 数组 表示 法 表示 如 图 6. 1 所 示 。 


fz 012345 
1[B ololilololilo 
le 1|1|lolololili 
3|D| 2|0olololiloli 
4[El| 3|0lolilololl 
s[F 4|1|1lolololo 
slolilililolo 
图 6.1 无 向 图 G 的 数组 表示 
建立 一 有 向 网 Gs ,用 数组 表示 法 表示 如 图 6. 2 所 示 。 
0 1m 4 
wo 0 9 2 
全 
3 5 0 8 
oo wm 6 0 


图 6.2 有 向 网 Gs 的 数组 表示 


2. 图 的 邻接 表 存 储 表示 


邻接 表 是 图 的 一 种 链 式 存储 方法 ,以 单 链表 来 记录 各 顶点 的 邻接 点 及 边 ( 弧 ) 的 信息 。 
每 个 链表 上 设 头 结 点 ,数据 域 存放 的 是 该 顶点 的 信息 ,指针 域 指向 第 一 个 与 之 相 邻 接 的 顶 
点 所 对 应 的 边 或 弧 的 信息 结 点 。data 是 顶点 内 容 ,firstarc 是 指向 第 一 条 边 或 弧 结 点 的 指 
针 。adjvex 是 该 边 或 弧 依附 的 顶点 在 数组 中 的 下 标 ,nextarc 是 指向 下 一 条 边 或 弧 结 点 的 


指针 。 硕 点 的 结 点 结构 和 弧 的 结 点 结构 如 图 6. 3 所 示 。 
顶点 的 结 点 结构 弧 的 结 点 结构 


data firstarc adjvex nextarc 


图 6.3 邻接 矩阵 表示 的 结 点 结构 


邻接 表 数 据 类 型 简单 定义 如 下 。 


const MAX VER NUM 20; // 最 大 顶点 个 数 
typedef struct VNode { 
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VertexType data; // 顶 点 信息 
ArcNode * firstarc; // 指 向 第 一 条 依附 该 项 点 的 弧 
} VNode, AdjList [MAX VER NUM]; 


typedef struct ArcNode { 


int adjvex; // 该 弧 所 指向 的 顶点 的 位 置 
struct ArcNode * nextarc; // 指 向 下 一 条 弧 的 指针 

} ArcNode; 

图 的 结构 定义 如 下 。 


typedef struct { 

AdjList vertices; 

int vexnum, arcnum; 

int kind; // 图 的 种 类 标志 
} ALGraph; 


建立 一 无 向 图 Gs 及 其 邻接 表 表示 如 图 6.4 所 示 。 


o[4[ 填 -| 十 -4 人 
1| 8 二 +=|5 IN 
alc 3 5 从 
3|D| 十 | 2| 十 =| 5 
4| 中 填 =| 0| 填 -和 
5 十 时 -HH-Gm 


图 6.4 无 向 网 Gs 及 其 邻接 表 表示 


6.3 图 的 遍历 


与 线性 表 及 树 的 遍历 类 似 ,图 的 遍历 就 是 按照 某 种 顺序 依次 访问 图 的 所 有 项 点 ,而 且 
每 个 顶点 仅 访问 一 次 。 图 的 遍历 也 是 现实 当中 经 常 遇 到 的 问题 ,例如 选择 旅游 路 线 等 。 
本 节 给 出 了 两 种 遍历 图 的 基本 方法 : 深度 优先 搜索 算法 和 广度 优先 搜索 算法 ,这 两 种 方 
法 都 适用 于 有 向 图 和 无 向 图 。 


1. 深度 优先 搜索 遍历 


深度 优先 搜索 遍历 是 从 图 中 某 个 顶点 Vs 出 发 ,访问 此 顶点 ,然后 依次 从 Vo 的 各 个 
未 被 访问 的 邻接 点 出 发 深度 优先 搜索 遍历 图 ,直至 图 中 所 有 和 V。 有 路 径 相通 的 顶点 都 
被 访问 到 。 显 然 ,这 是 一 个 递归 的 搜索 过 程 。 深 度 优先 搜索 遍历 连通 图 的 过 程 类 似 于 树 
的 先 根 遍 历 。 

下 面 讨论 如 何 实 现 深度 优先 搜索 遍历 算法 。 

从 图 中 某 一 起 始 顶 点 v 出 发 ,访问 它 的 未 被 访问 的 邻接 点 ;依次 进行 类 似 的 访问 , 直 
至 到 达 所 有 的 邻接 顶点 都 被 访问 过 的 顶点 为止。 接着 ,退回 一 步 , 即 看 刚 访问 过 的 顶点 
是 否 还 有 没 被 访问 过 的 邻接 点 。 如 有 , 则 访问 此 顶点 ,之 后 再 进行 与 前 述 类 似 的 访问 ;如 
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没有 ,就 再 退回 一 步 进行 搜索 。 重复 上 述 过 程 ,直到 连通 图 中 所 有 顶点 都 被 访问 过 为 止 。 
深度 优先 搜索 遍历 过 程 如 图 6. 5 所 示 ,访问 顺序 为 : wo 一 wy>v3 玉 Ui 六 Vs 阅 Vo 六 Us 阅 Ue 。 


@_ 一 @ 
C ® OR 
@ 7 ~ 
ORG ) (% ey 8 
1 
RONRGO OOOOR © (%) 
\GN 一 ~ 深 一 层 搜索 
@ © ©、、__\ -一 搜索 回 退 


图 6.5 深度 优先 搜索 遍历 过 程 


为 了 便于 在 算法 中 区 分 顶点 是 否 已 被 访问 过 ,需要 创建 一 个 一 维 数组 visited[0. .一 
1](n 是 图 中 顶点 的 数目 ) ,用 来 设置 访问 标志 ,其 初始 值 visited[i]j(0<i<n 一 1) 为 “0”, 表 
示 邻 接 表 中 下 标 值 为 i 的 顶点 没有 被 访问 过 ,一 旦 该 项 点 被 访问 ,将 visited[ 门 置 成 “1”。 
深度 优先 遍历 算法 如 下 。 


void DFS (Graph G, int v) { 
// 从 顶点 出 发 ,深度 优先 搜索 遍历 连通 图 G 
Visited[v] =TRUE; VisitFunc(v); 
for( w=FirstAdjVex (G, v); 
Ww!=NULL; w=NextAdjVex (G,v,w) ) 
if (!visited[w]) DFS(G, w); 
// 对 的 尚未 访问 的 邻接 项 点 w 调 用 DFS 


}//DFS 
首先 将 图 中 每 个 顶点 的 访问 标志 设 为 FALSE, 之 后 搜索 图 中 每 个 顶点 ,如 果 未 被 访 
问 过 , 则 以 该 顶点 为 起 始点 ,进行 深度 优先 搜索 遍历 ,否则 继续 检查 下 一 项 点。 


void DEFSTraverse (Graph G, Status (x*Visit) (int v)) { // 对 图 G 做 深度 优先 遍历 
VisitFunc =Visit; 
for (v=0; v<G.vexnum; ++V) visited[v] =FALSE; // 访 问 标志 数组 初始 化 
for (v=0; v<G.vexnum; ++V) if (!visited[v]) DEFS(G, Vv); 
// 对 尚未 访问 的 顶点 调用 DFs 
二 


2. 广度 优先 搜索 遍历 


类 似 于 树 的 按 层次 遍历 ,对 图 的 广度 优先 搜索 遍历 方法 描述 为 : 从 图 中 某 个 顶点 v 
出 发 ,在 访问 了 vv 之 后 ,依次 访问 vv 的 各 个 未 曾 访问 过 的 邻接 点 ,之 后 按 这 些 顶 点 被 访问 
的 先后 次 序 依 次 访问 它们 的 未 曾 访问 过 的 邻接 点 ,直至 图 中 所 有 和 vw 有 路 径 相通 的 顶点 
都 被 访问 到 。 若 此 时 图 中 尚 有 顶点 未 被 访问 , 则 另 选 图 中 一 个 未 曾 被 访问 的 顶点 作 起 始 
点 ,重复 上 述 过 程 ,直至 图 中 所 有 顶点 都 被 访问 到 为 止 。 广 度 优先 搜索 遍历 过 程 如 图 6. 6 
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所 示 ,访问 顺序 为 : wo 六 v1 六 vo 六 Vs 六 Us 六 Us 六 Us 六 vi。 


图 6.6 广度 优先 搜索 遍历 过 程 


下 面 讨论 实现 广度 优先 搜索 遍历 算法 需要 考虑 的 几 个 问题 。 

(1) 在 广度 优先 搜索 遍历 中 ,要 求 先 被 访问 的 顶点 其 邻接 点 也 被 优先 访问 ,因此 , 必 
须 对 每 个 顶点 的 访问 顺序 进行 记录 ,以 便 后 面 按 此 顺序 访问 各 顶点 的 邻接 点 。 应 利用 一 
个 队列 结构 记录 顶点 访问 顺序 ,就 可 以 利用 队列 结构 的 操作 特点 ,将 访问 的 每 个 顶点 入 
队 , 然 后 再 依次 出 队 , 并 访问 它们 的 邻接 点 。 

(2) 在 广度 优先 遍历 搜索 过 程 中 , 同 深度 优先 遍历 搜索 一 样 ,为 了 避免 重复 访问 某 个 
顶点 ,也 需要 创建 一 个 一 维 数组 visited[0..n 一 1](n 是 图 中 顶点 的 数目 ) ,用 来 记录 每 个 
顶点 是 否 已 经 被 访问 过 。 


广度 优先 遍历 算法 如 下 。 
void BFSTraverse (Graph G, Status (*Visit) (int v)){ 
for (v=0; v<G.vexnum; ++V) visited[v] =FALSE; // 初 始 化 访问 标志 
InitQueue (Q); // 置 空 的 辅助 队列 Q 
for (v=0; v<G.vexnum; ++V ) 
if ( !visited[v]) { //v 尚未 访问 
visited[v] =TRUE; Visit (v); // 访 问 v 
EnQueue (Q, Vv); //v 入 队列 
while (!QueueEmpty(Q)) { 
DeQueue (Q, u); // 队 头 元 素 出 队 并 置 为 u 


for (w=FirstAdjVex (G, u); w>=0; w=NextAdjVex (G,u,w)) 
if (!visited[w]) { 
visited[w]=TRUE; Visit (w) 7， 
EnQueue (Q, w); // 访 问 的 项 点 w 入 队列 
}//if 
}//while 


让 
}//BFSTraverse 


小 结 


本 章 主 要 介绍 图 的 定义 及 相关 术语 ,图 的 存储 表示 的 概念 ,图 的 遍历 方法 以 及 应 
用 等 。 
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(1) 图 是 一 种 较 线性 表 和 树 更 为 复杂 的 数据 结构 。 在 线性 表 中 ,数据 元 素 之 间 仅 有 
线性 关系 ;在 树 状 结构 中 ,数据 元 素 之 间 有 着 明显 的 层次 关系 ;而 在 图 形 结构 中 , 结 点 之 间 
的 关系 可 以 是 任意 的 ,图 中 任意 两 个 数据 元 素 之 间 都 可 能 相关 。 

(2) 有 关 图 的 基本 概念 包括 : 图 的 定义 和 特点 ,无 向 图 ,有 向 图 ,入 度 , 出 度 , 完 全 图 ， 
生成 图 ,路 径 长 度 ,( 强 ) 连 通 图 ,( 强 ) 连 通 分 量 等 。 

(3) 图 的 几 种 存储 形式 : 邻接 和 矩阵 ,邻接 表 等 。 

(4) 图 的 两 种 遍历 算法 ; 深度 优先 遍历 和 广度 优先 遍历 。 深 度 优先 遍历 和 广度 优先 
遍历 是 图 的 两 种 基本 的 遍历 算法 ,这 两 个 算法 对 图 的 重要 性 等 同 于 先 序 、 中 序 、 后 序 遍 历 
对 于 二 叉 树 的 重要 性 。 


习题 


6.1 已 知 带 权 有 向 图 如 图 6.7 所 示 , 画 出 该 图 的 邻接 矩阵 存储 结构 。 
6.2 已 知 图 的 结构 如 图 6. 8 所 示 , 给 出 图 的 深度 优先 遍历 序列 和 广度 优先 遍历 


序列 。 
0 
2 
(©) (0) (WD (9) 
Co 


图 6.7 带 权 有 向 图 的 示例 图 6.8 图 的 遍历 示例 
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第 7 章 查 找 


本 章 学 习 目标 
。 掌握 静态 查找 、 动 态 查找 和 哈 希 查找 的 基本 思路 。 
。 了解 静态 查找 ,动态 查找 和 哈 项 查找 的 性 能 分 析 方法 。 


在 日 常生 活 中 ,人 们 几乎 每 天 都 要 进行 “查找 ”。 如 在 英汉 字典 中 查找 某 个 英文 单 
词 对 应 的 中 文 解释 ;快递 员 送 件 按照 收 件 人 的 地 址 确定 投递 位 置 等 。 查 找 是 计算 机 应 
用 中 最 常用 的 操作 。 据 统计 ,商业 计算 机 应 用 系统 花费 在 这 方面 的 计算 时 间 超 过 
25%。 因 此 ,查找 算法 的 优 劣 对 系统 的 运行 效率 影响 极 大 。 本 章 将 系统 地 讨论 各 种 查 
找 方法 。 


7.1 基本 概念 


查找 (Searching) : 也 称 检查 ,是 指 在 数据 结构 中 找 出 满足 某 种 条 件 的 结 点 。 例 如 ,学 
生花 名 册 中 存放 着 全 体 学 生 记录 ,每 个 记录 包括 学 生 的 学 号 、 姓 名、 性 别 、 出 生年 月 、 住 址 
等 信息 。 按 学 号 或 姓名 查询 学 生 的 有 关 信 息 ,就 是 数据 查找 问题 ,也 称 查 表 。 

查找 表 (Search Table) 是 由 同一 类 型 的 数据 元 素 ( 或 记录 ) 构 成 的 集合 。 由 于 “集合 ” 
中 的 数据 元 素 之 间 存 在 着 松散 的 关系 ,因此 查找 表 是 一 种 应 用 灵活 的 结构 。 

对 查找 表 经 常 进行 的 操作 有 : 查询 ,查询 特定 记录 是 否 存 在 于 查找 表 中 ; 加 检索 ， 
找 出 某 个 特定 记录 的 各 种 属性 ; @ 搬 入 ,在 查找 表 中 插入 一 个 记录 ; @ 删 除 ,从 查找 表 中 
删 去 某 个 记录 。 若 对 查找 表 只 做 前 两 种 操作 , 则 称 此 类 查找 表 为 静态 查找 表 。 若 有 时 在 
查询 之 后 ,还 需要 将 不 存在 于 查找 表 中 的 数据 元 素 插 和 人 到 查找 表 中 ,或 者 将 存在 于 查找 表 
中 的 数据 元 素 删 除 , 则 称 此 类 查找 表 为 动态 查找 表 。 

关键 字 (Key) : 是 数据 元 素 中 某 个 数据 项 的 值 , 用 以 标识 一 个 数据 元 素 。 若 此 关键 字 
可 以 识别 唯一 的 一 个 记录 , 则 称 为 主 关键 字 ”。 若 此 关键 字 能 识别 若干 记录 , 则 称 为 “次 
关键 字 ”。 根 据 给 定 的 某 个 值 ,在 查找 表 中 确定 是 否 有 关键 字 等 于 给 定 值 的 数据 元 素 , 若 
查找 表 中 存在 与 给 定 值 相等 的 记录 , 则 称 “ 查 找 成 功 ”, 或 返回 整个 记录 的 信息 ,或 返回 记 
录 的 位 置 ; 若 查 找 表 中 不 存在 与 给 定 值 相等 的 记录 , 则 称 “ 查 找 不 成 功 ”, 返 回 0。 

由 于 查找 表 中 的 数据 元 素 之 间 不 存在 明显 的 组 织 规律 ,因此 不 便于 查找 。 因 此 ,经 常 
需要 在 数据 元 素 之 间 人 为 地 附加 某 种 确定 的 关系 ,以 提高 查找 的 效率 。 例 如 ,在 英汉 字典 
中 查找 某 个 英文 单词 时 ,不 需要 从 字典 中 的 第 一 个 单词 开始 比较 ,因为 字典 是 按照 单词 的 
首 字母 在 字母 表 中 的 次 序 编排 的 ,所 以 只 要 根据 待 查 单词 中 的 首 字母 在 字母 表 中 的 位 置 
便 能 查 到 该 单词 。 
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7.2 静态 查找 表 


静态 查找 表 可 以 有 不 同 的 组 织 方式 ,其 中 最 简单 的 是 线性 表 。 本 节 主 要 介绍 在 线性 
表 上 查找 的 三 种 方法 , 即 顺序 查找 、 折 半 查 找 和 索引 查找 。 为 了 方便 讨论 ,以 顺序 表 作为 
静态 查找 表 , 抽 象 数 据 类 型 静态 查找 表 的 定义 如 下 。 
RDT StaticSearchTable { 
数据 对 象 D:D 是 具有 相同 特性 的 数据 元 素 的 集合 。 每 个 数据 元 素 含有 类 型 相 同 的 关键 字 , 可 
唯一 标识 数据 元 素 。 
数据 关系 R: 数 据 元 素 同 属 一 个 集合 。 
基本 操作 P: P- {静态 查找 表 构造 ,销毁 表 操作 ，…} 
} ADT StaticSearchTable 
静态 查找 表 上 的 基本 操作 有 以 下 几 种 。 
(1) 静态 查找 表 构 造 操作 : Create( &ST, n)。 
初始 条 件 : 静态 查找 表 ST 不 存在 。 
操作 结果 : 构造 一 个 含有 个 数据 元 素 的 静态 查找 表 ST。 
(2) 销毁 表 操作 : Destroy( &ST)。 
初始 条 件 : 静态 查找 表 ST 存在 。 
操作 结果 : 销毁 表 ST。 
(3) 查找 操作 : Search(ST，key) 。 
初始 条 件 : 静态 查找 表 ST 存在 ,key 为 和 查找 表 中 元 素 的 关键 字 类 型 相同 的 给 
定 值 。 
操作 结果 : 若 ST 中 存在 其 关键 字 等 于 key 的 数据 元 素 , 则 函数 值 为 该 元 素 的 值 
或 在 表 中 的 位 置 ,否则 为 * 空 ”。 
静态 查找 表 在 不 同 的 表示 方法 中 ,实现 查找 操作 的 方法 也 不 同 。 


7.2.1 顺序 查找 


顺序 查找 又 称 线性 查找 ,是 最 基本 的 查找 方法 之 一 。 以 顺序 表 或 线性 链表 表示 静态 
查找 表 , 则 Search 函数 可 用 顺序 查找 来 实现 。 本 节 只 讨论 在 顺序 存储 结构 中 的 实现 , 静 
态 查找 表 的 顺序 存储 结构 如 下 。 


typedef struct { 


ElemType * elem; // 数 据 元 素 的 基地 址 ,0 号 单元 留 空 
int length; // 表 的 长 度 
} ssTable; 


顺序 查找 的 实现 方法 为 : 从 表 的 一 端 开 始 , 向 另 一 端 逐 个 进行 记录 的 关键 字 和 给 定 
值 的 比较 , 若 某 个 记录 的 关键 字 和 给 定 值 比 较 相等 , 则 查找 成 功 ,并 给 出 数据 元 素 在 表 中 
的 位 置 ; 若 整个 表 检 测 完 , 其 关键 字 和 给 定 值 比较 都 不 等 , 则 表明 表 中 没有 所 查 记录 ,查找 


60 


不 成 功 。 此 查找 过 程 可 用 以 下 算法 描述 。 


int location( SqList L, ElemTypeg& e, Status (* compare) (ElemType, ElemType)) { 
k=1; 
p=L.elemt+1; 
while ( k<=L.length g&&! (* compare) (*p, e))) { k++,p++; } 
if ( k<=L.length) return k; 
else return 0; 


} //location 


改进 后 的 顺序 查找 算法 如 下 。 

int Search Seq(SSTable ST, KeyType key) { 
ST.elem[0] .key =key; /A 哨兵 ” 
for (i=ST.length; ST.elem[i] .key!=key;--i); // 从 后 往 前 找 
return i; // 找 不 到 时 ,i 为 0 


} //Search Seq 


分 析 以 上 两 个 算法 ,都 是 查找 成 功 时 返回 key 值 在 查找 表 中 的 位 置 ,失败 时 返回 0。 
改进 前 算法 依据 数据 可 能 存在 的 位 置 可 对 表 进 行 正 反 两 个 方向 的 搜索 ,以 提高 效率 ;改进 
后 算法 一 般 从 反方 向 进行 搜索 ,简化 了 算法 。 在 此 ,下 标 为 0 的 单元 起 到 一 个 “监视 哨 ” 的 
作用 。 当 然 , 监 视 哨 也 可 设置 在 下 标高 端 处 ,查找 成 功 时 ,返回 值 为 对 应 的 下 标 值 ,失败 时 
可 返回 高 端 下 标 值 或 0。 

为 了 确定 记录 在 查找 表 中 的 位 置 , 需 和 给 定 关 键 字 进行 比较 的 次 数 的 期 望 值 称 为 查 
找 算法 的 平均 查找 长 度 。 在 等 概率 查找 的 情况 下 ,顺序 表 查 找 的 平均 查找 长 度 为 (n 十 
1)/2。 

在 实际 的 数据 查询 系统 中 ,记录 被 查找 的 频率 或 机 会 并 不 是 均等 的 。 一 般 情况 下 ,为 
了 提高 效率 ,把 经 常 查找 的 记录 尽量 放 在 后 面 , 则 可 降低 平均 查找 长 度 。 若 查找 概率 无 法 
事先 测定 , 则 查找 过 程 采取 的 改进 办 法 是 在 每 次 查找 之 后 ,将 刚刚 查找 到 的 记录 直接 移 至 
表 尾 的 位 置 上 。 

顺序 查找 的 优点 是 算法 简单 且 适 用 面 广 , 对 查找 表 的 结构 无 任何 要 求 。 无 论 是 用 顺 
序 表 还 是 用 链表 来 存放 记录 ,也 无 论 记录 之 间 是 否 按 关键 字 已 排序 ,都 可 以 使 用 这 种 查找 
方法 。 顺 序 查 找 的 缺点 是 查找 效率 低 , 尤 其 不 适合 表 内 元 素 较 多 时 的 查找 。 


7.2.2 折 半 查找 


折 半 查找 也 称 为 二 分 查找 ,这 是 一 种 效率 较 高 的 查找 方法 。 上 述 顺 序 查 找 表 的 查找 
算法 简单 ,但 平均 查找 长 度 较 大 ,特别 不 适用 于 表 长 较 大 的 查找 表 。 若 以 有 序 表 ( 以 升序 
为 例 ) 表 示 静 态 查 找 表 , 则 查找 过 程 可 以 基于 “ 折 半 ”进行 。 

折 半 查找 (或 二 分 查找 ) 的 思想 为 : 在 有 序 表 中 , 取 中 间 元 素 作为 比较 对 象 , 若 给 定 
值 与 中 间 元 素 的 关键 字 相 等 , 则 查找 成 功 ; 若 给 定 值 小 于 中 间 元 素 的 关键 字 , 则 在 中 间 
元 素 的 左 半 区 继续 查找 ; 若 给 定 值 大 于 中 间 元 素 的 关键 字 , 则 在 中 间 元 素 的 右 半 区 继 
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续 查 找 。 不 断 重复 上 述 查 找 过 程 ,直到 查找 成 功 ,或 所 查找 的 区 域 无 数据 元 素 , 查 找 
失败 。 
折 半 查找 算法 如 下 。 


int Search Bin ( SSTable ST, KeyType key ) { 
low =1; high =ST.lengthy // 置 区 间 初 值 
while (low <=high) { 
mid= (low +high) / 2; 
if (EQ (key, ST.elem[mid] .key) ) 
return mid; // 找 到 待 查 元 素 
else if (LT (key, ST.elem[mid] .key) ) 
high =mid -1; 
else low =mid +17 
}//while 
return 0; // 顺 序 表 中 不 存在 待 查 元 素 
} //search Bin 
在 等 概率 条 件 下 , 折 半 查找 成 功 时 的 平均 查找 长 度 为 logs(n 十 1) 一 1。 折 半 查 找 的 效 
率 较 高 ,但 它 要 求 查找 表 要 按 顺序 存储 , 且 按 关键 字 有 序 。 排 序 本 身 是 一 种 很 费时 的 运 
算 ,一 般 采 用 最 高 效 的 排序 方法 也 要 花费 O(nlogsn) 的 时 间 。 顺 序 存储 结构 不 适合 经 常 
做 插入 和 删除 操作 。 因 此 , 折 半 查找 特别 适合 于 一 经 建立 就 很 少 改动 而 又 经 常 需要 查找 
的 顺序 表 。 


7.2.3 索引 查找 


索引 顺序 查找 又 称 分 块 查找 ,是 对 顺序 查找 的 一 种 改进 。 在 此 查找 法 中 , 除 表 本 身 以 
外 ,还 需 建立 一 个 "索引 表 ”。 一 般 情况 下 ,索引 是 一 个 有 序 表 ,索引 表 按 关 键 字 有 序 , 则 表 
或 者 有 序 或 者 分 块 有 序 。 这 里 的 “分 块 有 序 ” 指 的 是 第 二 个 子 表 中 所 有 记录 的 关键 字 值 均 
大 于 第 一 个 子 表 中 的 最 大 关键 字 值 ,第 三 个 子 表 中 的 所 有 关键 字 值 均 大 于 第 二 个 子 表 中 
的 最 大 关键 字 值 ,以 此 类 推 。 查 找 时 , 先 用 给 定 值 在 索引 表 中 检测 索引 项 ,以 确定 所 要 进 
行 的 查找 在 查找 表 中 的 查找 分 块 ( 由 于 索引 项 按 关键 字 有 序 , 可 用 顺序 查找 或 者 折 半 查 
找 ) ,然后 再 对 该 分 块 进行 顺序 查找 。 索 引 查找 示例 如 图 7. 1 所 示 。 


start 30 | 65 | 90 
0 5 10 
Se 
20|15 | 30 40135 60 | 65 | 50 70[9%0 80175 


图 7.1 索引 查找 示例 


索引 表 是 按 索引 值 递 增 ( 或 递减 ) 有 序 ,索引 值 域 用 来 存储 对 应 块 的 最 大 关键 字 ,而 主 
表 中 块 内 的 关键 字 排 列 是 无 序 的。 索引 顺序 表 的 查找 过 程 是 : 首先 由 索引 确定 记录 所 在 
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区 间 ;然后 在 顺序 表 的 某 个 区 间 内 进行 查找 。 可 见 , 索 引 顺 序 查找 的 过 程 也 是 一 个 缩小 区 
间 的 查找 过 程 。 索 引 顺 序 查找 的 平均 查找 长 度 王 查找“ 索引 ?的 平均 查找 长 度 十 查找 “ 顺 
序 表 ” 的 平均 查找 长 度 。 


7.3 动态 查找 表 


7.2 节 介绍 的 三 种 查找 方法 的 特点 是 在 查找 过 程 中 对 找到 的 元 素 可 以 读 取 其 属性 ， 


更 新 其 值 ,一般 不 对 查找 表 进 行 插入 和 删除 元 素 操作 ,所 以 , 常 采用 静态 查找 表 作为 存储 
结构 。 如 果 在 查找 过 程 中 还 要 进行 插入 和 删除 操作 , 则 采用 动态 查找 表 作 为 存储 结构 。 
动态 查找 表 的 表 结构 是 在 查找 过 程 中 动态 生成 的 ,如 果 被 查找 的 值 与 查找 表 记 录 的 关键 
字 值 相等 , 则 可 能 要 进行 删除 操作 ,否则 可 能 要 进行 插入 操作 。 通 常 以 树 或 者 二 又 树 作 为 
动态 查找 表 的 组 织 形 式 。 

抽象 数据 类 型 动态 查找 表 的 定义 如 下 。 


ADT DynamicSearchTable { 
数据 对 象 D:D 是 具有 相同 特性 的 数据 元 素 的 集合 。 每 个 数据 元 素 含有 类 型 相同 的 关键 字 。 
数据 关系 R: 数 据 元 素 同 属 一 个 集合 。 
基本 操作 P: P= {初始 化 动态 查找 表 ,销毁 动态 查找 表 , 查找 操作 ,… } 


} DynamicSearchTable 


动态 查找 表 的 基本 操作 有 以 下 几 种 。 
(1) 初始 化 操作 : InitDSTable(& DT) 。 


初始 条 件 


操作 结果 : 
(2) 销毁 操作 ， 
初始 条 件 : 
操作 结果 : 
(3) 查找 操作 
初始 条 件 : 


操作 结果 


: 动态 查找 表 DT 不 存在 。 

构造 一 个 空 的 动态 查找 表 DT。 

DestroyDSTable(&DT) 。 

动态 查找 表 DT 存在 。 

销毁 动态 查找 表 DT。 

SearchDSTable(DT ,key) 。 

动态 查找 表 DT 存在 ,key 是 和 关键 字 类 型 相同 的 给 定 值 。 

: 若 DT 中 存在 其 关键 字 等 于 key 的 数据 元 素 , 则 函数 值 为 该 元 素 的 值 


或 在 表 中 的 位 置 ,否则 为 “ 空 。 


(4) 插入 操作 : 
初始 条 件 : 
操作 结果 : 


DT 中 。 


(5) 删除 操作 : 
初始 条 件 : 


操作 结果 


InsertDSTable( &DT, e), 
动态 查找 表 DT 存在 ,e 为 待 插入 的 数据 元 素 。 
车 DT 中 不 存在 其 关键 字 等 于 e. key 的 数据 元 素 , 则 将 。 插入 到 


DeleteDSTable(& DT，key) 。 
动态 查找 表 DT 存在 ,key 是 和 关键 字 类 型 相同 的 给 定 值 。 
: 若 DT 中 存在 其 关键 字 等 于 key 的 数据 元 素 , 则 删除 之 。 


动态 查找 表 的 结构 本 身 是 在 查找 中 动态 生成 的 , 即 在 查找 过 程 中 尚 需 进 行 “插入 ”或 
“删除 ”的 操作 。 因 此 ,表示 动态 查找 表 的 结构 应 不 仅 便于 查找 ,还 应 便于 插入 和 删除 。 
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7.3.1 二 叉 排序 树 


1 定 驻 
二 叉 排 序 树 (Binary Sort Tree) : 也 叫 二 又 查找 树 。 它 或 是 一 棵 空 树 ; 或 者 是 具有 如 


下 特性 的 二 叉 树 。 


(1) 若 它 的 左 子 树 不 空 , 则 左 子 树 上 所 有 结 点 的 值 均 小 于 根 结 点 的 值 ; 
(2) 若 它 的 右 子 树 不 空 , 则 右 子 树 上 所 有 结 点 的 值 均 大 于 根 结 点 的 值 ; 
(3) 它 的 左 ` 右 子 树 也 都 是 二 又 排序 树 。 

通常 , 取 二 又 链表 作为 二 又 排序 树 的 存储 结构 ,其 定义 如 下 。 


typedef struct BiTNode { // 结 点 结构 
TElemType data; 
struct BiTNode *1child, *rchild; // 左 右 孩 子 指针 
} BiTNode, * BiTree; 


2. 构造 二 又 排序 树 
通常 ,二 又 排序 树 是 由 依次 输入 的 数据 元 素 序 列 构造 而 成 的 ,构造 的 方法 如 下 。 设 


有 = {Ri ,Rs，…,R,}) 为 一 组 记录 ,可 以 按 下 列 的 方法 来 建立 二 叉 排 序 树 。 


(1) 令 Ri 为 二 又 树 的 根 ; 
(2) 若 Rs. key 二 Ri. key, 则 令 Rs 为 Ri 的 左 子 树 的 根 结 点 ;否则 令 Rs 为 Ri 的 右 子 


树 的 根 结 点 ; 
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(3) 对 Rs ,R,，…,R, 递归 重复 步骤 (2) 。 
3. 二 叉 排 序 树 的 查找 算法 


从 其 定义 可 见 , 二 叉 排序 树 的 查找 过 程 为 : 若 二 又 排序 树 为 空 , 则 查找 不 成 功 ;否则 ， 
(1) 若 给 定 值 等 于 根 结 点 的 关键 字 , 则 查找 成 功 ; 

(2) 若 给 定 值 小 于 根 结 点 的 关键 字 , 则 继续 在 左 子 树 上 进行 查找 ; 

(3) 若 给 定 值 大 于 根 结 点 的 关键 字 , 则 继续 在 右 子 树 上 进行 查找 。 

上 述 查 找 过 程 的 算法 描述 如 下 。 


Status SearchBST ( BiTree T, KeyType key, BiTree f, BiTree &P ) { 

// 在 根 指针 T 所 指 二 叉 排 序 树 中 递归 地 查找 其 关键 字 等 于 key 的 数据 元 素 , 若 查找 成 功 , 则 
返回 p 指向 的 结 点 ,并 返回 函数 值 为 TRUE 

// 若 查找 不 成 功 , 返 回 p 指向 最 后 访问 的 结 点 ,并 返回 函数 值 为 FALSE, 指 针 £ 指向 当前 访 
问 的 结 点 的 双亲 ,其 初始 调用 值 为 NULL 

if (!T) {p=f; return FALSE; } // 查 找 不 成 功 

else if ( EQ(key, T->data.key) ) {p=T; return TRUE; } // 查 找 成 功 

else if (LT(key, T->data.key) ) return SearchBST (T->1lchild, key, T, p ); 

// 在 左 子 树 中 继续 查找 


else return SearchBST (T->rchild, key, T, p ); // 在 右 子 树 中 继续 查找 
} //SearchBST 


4. 二 叉 查 找 树 的 插入 算法 


根据 动态 查找 表 的 定义 “搬入 ”操作 在 查找 不 成 功 时 才 进 行 。 其 特点 是 , 若 二 又 查找 
树 为 空 树 , 则 新 插入 的 结 点 为 新 的 根 结 点 ;否则 ,新 插入 的 结 点 必 为 一 个 新 的 叶子 结 点 ,其 
插入 位 置 由 查找 过 程 得 到 。 其 算法 描述 如 下 。 

Status Insert BST(BiTree gT, ElemType e ) { 


// 二 叉 查找 树 中 不 存在 关键 字 e.key 时 ,插入 元 素 值 为 e 的 结 点 ,并 返回 TRUE; 
// 和 否则 ,不 进行 插入 并 返回 FALSE 


if (!SearchBST (T, e.key, NULL, p)) { // 查 找 不 成 功 
s= (BiTree) malloc (sizeof (BiTNode)); // 为 新 结 点 分 配 空间 
s->data =e; s->lchild =s->rchild =NULL; 
i (WB) Ts // 插 入 s 为 新 的 根 结 点 
else if (LT(e.key, p->data.key) ) p->lchild =s; // 插 入 *s 为 *p 的 左 孩 子 
else p->rchild =s; // 插 入 * s 为 *p 的 右 孩子 
return TRUE; // 插 入 成 功 


} 
else return FALSE; 
}//Insert BST 


5. 二 叉 查 找 树 的 删除 算法 


和 插入 相反 ,删除 在 查找 成 功 之 后 进行 ,并 且 要 求 在 删除 二 叉 查找 树 上 某 个 结 点 之 
后 ,仍然 保持 二 叉 查找 树 的 特性 。 可 分 为 以 下 三 种 情况 讨论 。 

(1) 若 被 删除 的 结 点 是 叶子 结 点 : 其 双亲 结 点 中 相应 指针 域 的 值 改 为 “ 空 ”。 

(2) 若 被 删除 的 结 点 只 有 左 子 树 或 者 只 有 右 子 树 : 其 双亲 结 点 的 相应 指针 域 的 值 改 
为 指向 被 删除 结 点 的 左 子 树 或 右 子 树 。 

(3) 若 被 删除 的 结 点 既 有 左 子 树 ,也 有 右 子 树 : 以 其 前 驱 替 代 之 ,然后 再 删除 该 前 驱 
结 点 。 
其 算法 描述 如 下 。 


Status DeleteBST (BiTree &T, KeyType key ) { 
if (!T) return FALSE; // 不 存在 关键 字 等 于 key 的 数据 元 素 
elsef 
if (EQ (key, T->data.key) ) {return Delete (T);} 
// 找 到 关键 字 等 于 key 的 数据 元 素 
else if (LT (key, T->data.key) ) return DeleteBST ( T->lchild, key ); 
// 继 续 在 左 子 树 中 进行 查找 
else return DeleteBST ( T->rchild, key ); // 继 续 在 右 子 树 中 进行 查找 
. 
} //DeleteBsT 
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6. 查找 性 能 的 分 析 


二 叉 树 的 优点 是 : 二 叉 树 是 动态 生成 的 ,采用 链表 结构 ,因此 插入 、 删 除 、 查 找 方便 ， 
二 叉 查 找 树 的 平均 查找 长 度 为 O(logzn) ,在 查找 速度 上 与 折 半 查找 相差 不 大 ,因此 ,适合 
经 常 做 插入 删除 和 查找 的 表 。 


7.3.2 平衡 二 又 树 


从 前 面 的 讨论 可 知 , 二 叉 排序 树 的 查找 效率 与 二 又 排序 树 结 点 插入 的 次 序 有 关 。 但 
是 , 结 点 插入 的 先后 次 序 是 不 确定 的 ,这 就 要 求 我 们 找到 一 种 动态 平衡 的 方法 ,对 于 任意 
给 定 的 关键 字 序列 都 能 构造 一 棵 形态 均匀 的 二 又 排序 树 。 动 态 平衡 技术 的 基本 思路 是 : 
每 当 插入 一 个 结 点 时 , 若 破坏 了 树 的 平衡 性 , 则 找 出 其 中 最 小 不 平衡 子 树 ,在 保持 排序 树 
特性 的 前 提 下 ,调整 最 小 不 平衡 子 树 中 各 接点 之 间 的 连接 关系 ,以 达到 新 的 平衡 。 

平衡 二 叉 树 (Balanced Binary Tree) : 它 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 性 质 的 二 
叉 树 : 它 的 左 子 树 和 右 子 树 都 是 平衡 二 又 树 ,并且 树 中 每 个 结 点 的 左 、 右 子 树 深度 之 差 的 
绝对 值 不 大 于 1。 

在 平衡 树 上 进行 查找 的 过 程 和 二 叉 排序 树 相同 ,因此 ,查找 过 程 中 和 给 定 值 进行 比较 
的 关键 字 的 个 数 不 超过 平衡 树 的 深度 As*log: (n)。 在 平衡 二 叉 树 上 进行 查找 时 ,和 关键 
字 进 行 比较 的 次 数 是 和 logs (>) 等 数量 级 的 , 即 在 平衡 树 上 进行 查找 的 时 间 复 杂 度 为 
O(log: (n))。 


7.4 哈 希 表 的 查找 


1. 哈 希 表 


以 上 两 节 讨论 的 表示 查找 表 的 各 种 结构 的 共同 特点 是 : 记录 在 表 中 的 位 置 和 它 的 关 
键 字 之 间 不 存在 一 个 确定 的 关系 ,因此 ,查找 的 过 程 为 将 给 定 值 依次 和 关键 字 集 合 中 各 个 
关键 字 进 行 比较 ,查找 的 效率 取决 于 和 给 定 值 进 行 比较 的 关键 字 个 数 。 用 这 类 方法 表示 
的 查找 表 , 其 平均 查找 长 度 都 不 为 零 ,不 同 查 找 方法 的 差别 仅 在 于 比较 顺序 的 不 同 。 

对 于 频繁 使 用 的 查找 表 ,希望 平 均 查 找 长 度 为 零 或 尽量 接近 零 , 即 不 经 过 任何 比较 ， 
可 直接 存 取 所 查 记录 。 那 么 只 有 一 个 办 法 ,就 是 预先 知道 所 查 关 键 字 在 表 中 的 位 置 , 即 要 
求 记录 在 表 中 位 置 和 其 关键 字 之 间 存 在 一 种 确定 的 关系 ,使 每 个 关键 字 和 结构 中 一 个 叭 
一 的 存储 位 置 相对 应 。 例 如 ,为 每 年 招收 的 1000 名 新 生 建 立 一 张 查找 表 , 其 关键 字 为 学 
号 ,其 值 的 范围 为 XX000 一 X X999 (前 两 位 为 年 份 )。 若 以 下 标 为 000 一 999 的 顺序 表 
表示 之 , 则 查找 过 程 可 以 简单 进行 : 取 给 定 值 (学 号 ) 的 后 三 位 ,不 需要 经 过 比较 便 可 直接 
从 顺序 表 中 找到 待 查 关键 字 。 但 是 ,对 于 动态 查找 表 而 言 : 表 长 不 确定 ; @ 在 设计 查 
找 表 时 ,只 知道 关键 字 所 属 范围 ,而 不 知道 确切 的 关键 字 。 因 此 在 一 般 情况 下 , 需 在 关键 
字 与 记录 在 表 中 的 存储 位 置 之 间 建立 一 个 函数 关系 ,以 了 H(key) 作 为 关键 字 为 key 的 记 
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录 在 表 中 的 位 置 ,通常 称 这 个 函数 有 H(key) 为 哈 希 函数 。 

根据 设 定 的 哈 希 函数 HH(key) 和 所 选中 的 处 理 冲突 的 方法 ,将 一 组 关键 字 映 像 到 一 
个 有 限 的 、 地 址 连续 的 地 址 集 (区 间 ) 上 ,并 以 关键 字 构 造 的 哈 希 函数 值 作为 相应 记录 在 
表 中 的 存储 位 置 ,如 此 构造 所 得 的 查找 表 称 为 “ 哈 希 表 ”。 简 单 地 说 , 哈 希 表 是 基于 哈 希 函 
数 建立 的 一 种 查找 表 。 


2. 哈 希 函数 的 构造 


一 个 好 的 哈 希 函数 应 满足 下 列 条 件 : 哈 希 函数 应 是 简单 的 ,能 在 较 短 的 时 间 内 计 
算出 结果 ; @ 哈 希 函 数 的 定义 域 必须 包括 需要 存储 的 全 部 关键 字 , 如 果 哈 希 表 人 允许 及 
个 地 址 时 ,其 值 域 必 须 为 0 一 m 一 1; @ 哈 希 函数 计算 出 来 的 地 址 应 能 均匀 分 布 在 整个 地 
址 空间 中 。 

常用 的 构造 哈 希 函数 的 方法 有 以 下 几 个 。 

1) 直接 定 址 法 

哈 希 函数 为 关键 字 的 线性 函数 也 (key) 二 aX key 十 b(a, 0 为 常数 ) ,这 类 函数 是 一 对 
一 的 映射 ,一般 不 会 产生 冲突 。 但 是 , 它 要 求 哈 希 地 址 空间 的 大 小 与 关键 字 集 合 的 大 小 相 
同 , 因 此 ,对 于 较 大 的 关键 字 集合 不 适用 。 

例如 ,有 一 组 关键 字 : {942148, 941269, 940527, 941630, 941805, 941558, 942047， 
940001) , 哈 希 函数 为 

H(key)=key—940000 

H(942148)=2148 H(941269)=1269 

H(940527)=527 H(941630)=1630 

H(941805)=1805 H(941558)=1558 

H(942047)=2047  H(940001)=1 
可 以 按 计算 出 的 地 址 存放 记录 。 

2) 数字 分 析 法 

假设 关键 字 集 合 中 的 每 个 关键 字 都 是 由 s 位 数字 组 成 (wu ,ws，…,u,) ,分析 关键 字 集 
中 的 全 体 ,并 从 中 提取 分 布 均匀 的 若干 位 或 它们 的 组 合作 为 地 址 。 此 方法 仅 适合 于 能 预 
先 估计 出 全 体 关 键 字 的 每 一 位 上 各 种 数字 出 现 的 频 度 的 情况 。 

3) 平方 取 中 法 

以 关键 字 的 平方 值 的 中 间 几 位 作为 存储 地 址 。 求 “关键 字 的 平方 值 ? 的 目的 是 “扩大 
差别 ”, 同 时 平方 值 的 中 间 各 位 又 能 受到 整个 关键 字 中 各 位 的 影响 。 此 方法 适合 于 关键 字 
中 的 每 一 位 都 有 某 些 数字 重复 出 现 频 度 很 高 的 现象 。 

4) 折 释 法 

此 方法 把 关键 字 自 左 到 右 分 成 位 数 相等 的 几 部 分 ,每 一 部 分 的 位 数 应 与 哈 希 表 地 址 
位 数 相同 ,只 有 最 后 一 部 分 的 位 数 可 以 短 一 些 。 各 部 分 的 数据 和 至 加 起 来 ,得 到 哈 希 地 址 。 
折 友 法 适合 于 关键 字 的 数字 位 数 特 别 多 的 情况 ,例如 ,身份 证 号 码 作 关键 字 。 

5) 除 留 余数 法 

设 哈 希 表 中 允许 地 址 数 为 m, 取 一 个 不 大 于 x, 但 最 接近 于 或 等 于 m 的 质数 p 作为 
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除数 ,利用 哈 希 函数 把 关键 字 转 换 成 哈 希 地 址 。 设 定 喻 希 函数 为 : H(key) 二 key%p(p 牵 
m) ,其 中 ,“%” 是 整数 除法 取 余 的 运算 ,p 三 m( 表 长 ) 并 且 p 应 为 不 大 于 m 的 素数 或 是 不 
含 20 以 下 的 质 因子 。 

例如 ,有 一 个 关键 字 key 王 962148 , 散 列表 大 小 m= 二 25, 即 HT[25]。 取 质数 p 二 23。 则 
哈 希 地 址 为 (962148) 二 962148 %23 二 12, 可 以 按 计 算出 的 地 址 存放 记录 。 需 要 注意 的 是 : 
哈 希 函数 计算 出 来 的 地 址 范围 是 0 一 22。 地 址 23 和 24, 只 可 能 在 处 理 冲突 时 达到 。 

6) 随机 数 法 

设 定 哈 希 函 数 为 : 瓦 (key) 王 Random(key) ,其 中 ,Random 为 伪 随机 函数 。 通 常 ,此 
方法 用 于 对 长 度 不 等 的 关键 字 构 造 哈 希 函数 。 实 际 造 表 时 ,采用 何 种 方法 构造 哈 希 函数 
取决 于 建 表 的 关键 字 集 合 的 情况 (包括 关键 字 的 范围 和 形态 ) ,总 的 原则 是 使 产生 冲突 的 
可 能 性 降 到 尽 可 能 地 小 。 


3. 处 理 冲突 的 方法 


一 个 “好 ”的 哈 希 函数 只 能 尽量 减少 冲突 ,而 不 能 避免 冲突 ,因此 如 何 处 理发 生 的 冲突 
是 建 哈 希 表 不 可 缺少 的 一 个 方面 。 处 理 冲 突 的 实际 含义 是 为 产生 冲突 的 地 址 寻找 下 一 个 
哈 希 地 址 。 通 常 使 用 的 处 理 冲突 的 方法 有 下 列 几 种 。 

1) 开放 定 址 法 

开放 定 址 法 就 是 为 产生 冲突 的 地 址 H(key) 求 得 一 个 尚未 被 记录 占用 的 位 置 。 地 址 
序列 ; Ho, Hi, H;,…,H,(1 二 s 寺 m 一 1), 其 中 ,Ho 二 H(key),H;= (H(key) 十 d;) 


mod m(i 二 1,2,…,s) ,对 增 量 di 有 三 种 取 法 : 四 线性 探测 再 散 列 ,di = c Xi, 最 简单 的 
情况 是 c=1; @ 平 方 探测 再 散 列 ,d; 二 1 ,一 1 ,22 ,一 2 ,…; @ 随 机 探测 再 散 列 ,d; 二 iX 
有 H; (key) (又 称 双 散 列 函数 探测 ) ,或 者 d; 是 一 组 伪 随 机 数列 。 

2) 链 地 址 法 


链 地 址 法 的 基本 思路 是 将 所 有 哈 希 地 址 相同 的 记录 都 链接 在 同一 链表 中 。 因 此 在 这 
种 方法 中 , 哈 希 表 的 每 个 单元 中 存放 的 不 再 是 对 象 ,而 是 相应 同义词 单 链表 的 头 指针 。 


4. 哈 希 表 的 查找 及 其 分 析 


在 哈 希 表 上 进行 查找 的 过 程 和 哈 希 造 表 的 过 程 基本 一 致 。 给 定 K 值 , 根 据 造 表 时 设 
定 的 哈 希 函数 求 得 哈 希 地 址 , 若 表 中 此 位 置 上 没有 记录 , 则 查找 不 成 功 ;和 否则 比较 关键 字 ， 
若 和 给 定 值 相 等 , 则 查找 成 功 ;否则 根据 造 表 时 设 定 的 处 理 冲 突 的 方法 找 “ 下 一 地 址 ”, 直 
至 哈 希 表 中 某 个 位 置 为 “ 空 ”或 者 表 中 所 填 记 录 的 关键 字 等 于 给 定 值 时 为 止 。 

从 查找 过 程 得 知 , 哈 希 表 查找 的 平均 查找 长 度 实 际 上 并 不 等 于 零 。 因 此 决定 哈 希 表 
查找 的 平均 查找 长 度 的 因素 有 以 下 三 个 : 选用 的 哈 希 函数 ; @ 选 用 的 处 理 冲突 的 方 
法 ; @ 哈 希 表 饱和 的 程度 ,装载 因子 值 的 大 小 a 二 n/m(n: 记录 数 ,m: 表 的 长 度 ) 。 

一 般 情况 下 ,可 以 认为 选用 的 哈 希 函数 是 “均匀 ”的 , 则 在 讨论 平均 查找 长 度 时 ,可 不 
考虑 它 的 因素 。 因 此 , 哈 希 表 的 平均 查找 长 度 是 处 理 冲 突 方 法 和 装载 因子 的 函数 。 在 哈 
和 希 函 数 相 同 的 情况 下 ,处 理 冲 突 的 方法 不 同 ,平均 查找 长 度 也 不 同 。 对 开放 定 址 处 理 冲 突 
的 蛤 希 表 而 言 , 表 长 必须 大 于 或 等 于 记录 数 , 并 且 表 中 已 填 入 的 记录 越 多 ,继续 插入 发 生 
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冲突 的 可 能 性 就 越 大 。 而 链 地 址 处 理 冲 突 不 会 出 现 这 种 情况 , 它 的 平均 查找 长 度 主要 取 
决 于 哈 希 函数 本 身 。 用 哈 希 表 构造 查找 表 时 ,可 以 选择 一 个 适当 的 装填 因子 a, 使 得 平均 
查找 长 度 限 定 在 某 个 范围 内 ,这 是 哈 希 表 的 特点 。 


小 结 


本 章 主要 介绍 静态 查找 、 动 态 查找 和 哈 希 查找 的 基本 思路 、 实 现 方法 及 性 能 分 析 
方法 。 

(1) 查找 (Searching) 就 是 根据 给 定 的 某 个 值 ,在 查找 表 中 确定 一 个 其 关键 字 等 于 给 
定 值 的 数据 元 素 ( 或 记录 )。 

(2) 查找 表 (Search Table) 是 同一 类 型 的 数据 元 素 ( 或 记录 ) 构 成 的 集合 。 

(3) 查找 表 按 照 操作 方式 分 为 两 大 类 : 静态 查找 表 和 动态 查找 表 。 

(4) 静态 查找 表 分 为 顺序 查找 、 折 半 查 找 和 索引 查找 三 种 查找 方法 。 顺 序 查找 的 思 
想 是 逐个 比较 ,直到 找到 或 者 查找 失败 。 折 半 查 找 又 称 二 分 查找 ,其 思想 是 对 于 已 经 按照 
一 定 顺 序 排 列 好 的 列表 ,每 次 都 用 关键 字 和 中 间 的 元 素 对 比 ,然后 判断 是 在 前 半 部 分 还 是 
后 半 部 分 还 是 就 是 中 间 的 元 素 , 然 后 继续 用 关键 字 和 中 间 的 元 素 对 比 。 索 引 查找 的 思想 
是 把 无 序 的 列表 分 成 若干 子 块 ,然后 建立 一 个 索引 表 ,记录 每 个 子 块 中 的 某 个 关键 字 , 然 
后 用 关键 字 和 这 个 索引 表 进 行 对 比 。 该 索引 表 还 存储 子 块 的 起 始 位 置 ,所 以 可 以 使 用 折 
半 查 找 或 者 顺序 查找 确定 关键 字 所 在 的 子 块 位 置 。 进 入 子 块 后 ,使 用 顺序 查找 法 查找 。 

(5) 二 又 排序 树 的 特点 是 : 车 它 的 左 子 树 非 空 , 则 左 子 树 上 所 有 结 点 的 值 均 小 于 
它 的 根 结 点 的 值 ; @ 若 它 的 右 子 树 非 空 , 则 右 子 树 上 所 有 结 点 的 值 均 大 于 (或 大 于 或 等 
于 ) 它 的 根 结 点 的 值 ; @ 它 的 左 、 右 子 树 也 分 别 为 二 叉 排 序 树 。 查 找 的 时 候 ,中 序 遍 历 二 
叉 树 ,得 到 一 个 递增 有 序 序列 。 查 找 思路 类 似 于 折 半 查找 。 

(6 ) 平 衡 二 又 排序 树 ,首先 它 也 是 二 又 排序 树 , 但 是 还 要 具有 如 下 性 质 ; 左 子 树 和 
右 子 树 的 深度 之 差 的 绝对 值 小 于 等 于 1; @ 左 子 树 和 右 子 树 也 是 平衡 二 又 树 。 

(7) 哈 希 查找 的 思想 : 首先 在 元 素 的 关键 字 k 和 元 素 的 存储 位 置 之 间 建 立 一 个 对 
应 关系 电 ,使 得 p= 二 H(k),H 称 为 哈 希 函数 。 创 建 哈 希 表 时 ,把 关键 字 为 & 的 元 素 直 接 存 
入 地 址 为 也 (k) 的 单元 ;以 后 当 查 找 关键 字 为 k 的 元 素 时 ,再 利用 哈 希 函数 计算 出 该 元 素 


式 : 开放 定 址 法 ; @ 链 地 址 法 。 
习题 

7.1 设计 一 个 程序 ,输出 在 顺序 表 {3,6,2,10,1,8,5,7,4,9) 中 采用 顺序 查找 方法 
查找 关键 字 5 的 过 程 。 


7.2 编写 算法 ,利用 折 半 查找 算法 在 一 个 有 序 表 中 插入 一 个 元 素 x+, 并 保持 表 的 有 
序 性 。 
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本 章 学 习 目标 
。 掌握 各 种 排序 方法 的 基本 思路 和 实现 算法 。 
。 了 解 各 种 排序 方法 的 基本 性 能 和 分 析 方法 。 


排序 是 数据 处 理 中 一 种 最 常用 的 操作 ,是 将 任 一 文件 中 的 记录 通过 某 种 方法 整理 成 
为 按 ( 记 录 ) 关 键 字 有 序 排 列 的 处 理 过 程 。 为 了 便于 查找 ,通常 希望 计算 机 中 的 数据 表示 
按 关 键 字 有 序 。 如 有 序 表 的 折 半 查找 ,查找 效率 较 高 。 另 外 ,二 又 排序 树 的 构造 过 程 本 身 
就 是 一 个 排序 过 程 。 因 此 ,学 习 和 研究 各 种 排序 方法 是 计算 机 工作 者 的 重要 课题 之 一 。 


8.1 基本 概念 


排序 (Sorting) : 排序 是 将 一 批 (组 ) 任 意 次 序 的 记录 重新 排列 成 按 关键 字 有 序 的 记录 
序列 的 过 程 。 其 定义 为 : 给 定 一 组 记录 序列 {Ri,R:,…','R,} ,其 相应 的 关键 字 序列 是 
{K KK) 。 确 定 1,2,…, 的 一 个 排列 Pi ,ps，,…,p, ,使 其 相应 的 关键 字 满 足 如 下 
非 递 减 (或 非 递增 ) 关 系 : Kp 三 Kp 三 … 三 Kp 的 序列 {Kp ,Kps，… ,Kp }) ,这 种 操作 称 为 
排序 。 

关键 字 K; 可 以 是 记录 尺 , 的 主 关键 字 , 也 可 以 是 次 关键 字 或 若干 数据 项 的 组 合 。 若 
关键 字 K; 是 主 关键 字 , 则 对 于 任意 待 排序 序列 ,经 排序 后 得 到 的 结果 是 唯一 的 ; 若 关键 
字 K; 是 次 关键 字 ,排序 后 得 到 的 结果 可 能 不 唯一 。 

排序 的 稳定 性 : 如 果 在 待 排序 的 记录 序列 中 有 两 个 或 两 个 以 上 数据 元 素 的 关键 字 值 
相同 ; K; 二 Kj(i 关 j,i,j 二 1,2,…,n), 且 在 排序 前 R; 先 于 R;(i<j) ,经 过 排序 后 ,这 些 数 
据 元 素 的 相对 次 序 保持 不 变 : 记录 序列 仍然 是 R; 先 于 R;, 则 称 这 种 排序 算法 是 稳定 的 ， 
否则 称 之 为 不 稳定 的 。 

根据 在 排序 过 程 中 待 排序 的 所 有 数据 元 素 是 否 全 部 被 放置 在 内 存 中 ,可 将 排序 方法 
分 为 内 部 排序 和 外 部 排序 两 大 类 。 内 部 排序 是 指 在 排序 的 整个 过 程 中 , 待 排序 的 所 有 数 
据 元 素 全 部 被 放置 在 内 存 中 ;外 部 排序 是 指 由 于 待 排序 的 数据 元 素 个 数 太 多 ,不 能 同时 放 
置 在 内 存 ,而 需要 将 一 部 分 数据 元 素 放 置 在 内 存 , 另 一 部 分 数据 元 素 放置 在 外 设 上 ,整个 
排序 过 程 需要 在 内 外 存 之 间 多 次 交换 数据 才能 得 到 排序 的 结果 。 本 章 只 讨论 常用 的 内 部 
排序 方法 。 内 部 排序 的 方法 很 多 ,但 就 全 面 性 能 而 言 , 还 没有 一 种 公认 为 最 好 的 。 每 种 算 
法 都 有 其 优点 和 缺点 ,分 别 适合 不 同 的 数据 量 和 硬件 配置 。 按 所 用 的 标准 不 同 ,排序 方法 
可 分 为 5 大 类 : 插入 排序 ,交换 排序 ,选择 排序 ,归并 排序 和 基数 排序 。 本 章 只 讨论 前 
4 类 。 


评价 排序 算法 效率 的 方法 主要 有 两 个 : 执行 时 间 和 所 需 的 辅助 空间 。 执 行 时 间 指 在 
数据 量规 模 一 定 的 条 件 下 ,算法 执行 所 消耗 的 平均 时 间 。 对 于 排序 操作 ,时 间 主 要 消耗 在 
关键 字 之 间 的 比较 和 数据 元 素 的 移动 上 ,因此 可 以 认为 高 效率 的 排序 算法 应 该 具有 尽 可 
能 少 的 比较 次 数 和 尽 可 能 少 的 数据 元 素 移动 次 数 。 辅 助 存储 空间 是 指 在 数据 量规 模 一 定 
的 条 件 下 ,除了 存放 待 排序 数据 元 素 占用 的 存储 空间 之 外 ,执行 算法 所 需要 的 其 他 存储 空 
间 。 理 想 的 空间 效率 是 算法 执行 期 间 所 需要 的 辅助 空间 与 待 排序 的 数据 量 无 关 。 

待 排序 记录 序列 可 以 用 顺序 存储 结构 和 链 式 存储 结构 表示 。 在 本 章 的 讨论 中 ,将 待 
排序 的 记录 序列 用 顺序 存储 结构 表示 , 即 用 一 维 数组 实现 。 其 定义 如 下 所 示 。 


#define MAXSIZE 20 


typedef int KeyType; // 定 义 关键 字 类 型 为 整数 类 型 (也 可 以 为 其 他 类 型 ) 
typedef struct { 
KeyType key; // 关 键 字 项 
InfoType otherinfo; // 其 他 数据 项 
} RecordType; 
typedef struct { 
RecordType r [MAXSIZE +1] ; //r[0] 闲 置 或 者 作为 哨兵 单元 
int length ; // 顺 序 表 长 度 
} sqList; // 顺 序 表 类 型 
8.2 ”插入 排序 


插入 排序 的 主要 思路 是 不 断 地 将 待 排序 的 数值 插入 到 有 序 段 中 ,使 有 序 段 逐 渐 扩 大 ， 
直至 所 有 数值 都 进入 有 序 段 中 的 位 置 。 


8.2.1 直接 插入 排序 


1. 基本 思想 


直接 插入 排序 (Straight Insertion Sort) 是 一 种 比较 简单 的 排序 方法 ,是 以 * 玩 桥牌 
者 ”的 方法 为 基础 的 。 即 在 考察 记录 R; 之 前 , 设 以 前 的 所 有 记录 Ri ,R: ,…， Ri-: 已 排 好 
序 , 然 后 将 R; 插入 到 已 排 好 序 的 诸 记录 的 适当 位 置 。 

它 的 基本 思想 是 依次 将 记录 序列 中 的 每 一 个 记录 插入 到 有 序 段 中 ,使 有 序 段 的 长 度 
不 断 地 扩大 。 其 具体 的 排序 过 程 可 以 描述 如 下 : 首先 将 待 排序 记录 序列 中 的 第 一 个 记录 
作为 一 个 有 序 段 ,将 记录 序列 中 的 第 二 个 记录 插入 到 上 述 有 序 段 中 形成 由 两 个 记录 组 成 
的 有 序 段 ,再 将 记录 序列 中 的 第 三 个 记录 插入 到 这 个 有 序 段 中 ,形成 由 三 个 记录 组 成 的 有 
序 段 ,…… 以 此 类 推 ,每 一 赵 都 是 将 一 个 记录 插入 到 前 面 的 有 序 段 中 。 假 设 当前 处 理 第 i 
个 记录 , 则 应 该 将 这 个 记录 插入 到 由 前 i 一 1 个 记录 组 成 的 有 序 段 中 ,从 而 形成 一 个 由 i 
个 记录 组 成 的 按 关键 字 值 排列 的 有 序 序列 ,直到 所 有 记录 都 插入 到 有 序 段 中 。 一 共 需 要 
经 过 ?一 1 趟 就 可 以 将 初始 序列 的 nn 个 记录 重新 排列 成 按 关 键 字 值 大 小 排列 的 有 序 序列 。 
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例如 , 设 有 关键 字 序列 为 7,4, 一 2,19,13,6, 直 接 插入 排序 的 过 程 如 图 8. 1 所 示 。 
初始 记录 的 关键 字 : 


[7 4-2 19 1356 
第 一 趟 排序 : [4 7] -2 19 13 6 
第 [ 


3 


:[247 19 1 6 


第 三 趟 排序 : [2 4 7 191 13 6 
第 四 趟 排序 : [2 4 7 13 19] 6 


第 五 趟 排序 : [2 4 6 7 13 19] 
图 8.1 直接 插入 排序 示例 


2. 算法 实现 
完整 的 直接 插 和 人 排序 算法 描述 如 下 。 
void StraightInsertSort ( SqList &L ) 
{nt // 对 顺序 表 工 做 直接 插入 排序 
for (i=2; i<=L.length; ++i ) // 直 接 在 原始 无 序 表 工 中 排序 
if (LT(L.R[i].key, L. R[i-1].key)) 1/ 车工 .r [i] 较 小 则 插入 有 序 子 表 内 
{ LL.RIO]=L.R[i]; // 先 将 待 插入 的 元 素 放 入 “哨兵 "位置 
L.R[i]=L.R[i-1]; // 子 表 元 素 开始 后 移 
for (j=i-2; LT(L.R[0] .key, L.R[j] .key); --j) 
L.R[j+1]=L.R[j]; // 只 要 子 表 元 素 比 哨兵 大 就 不 断后 移 
L.R[j+1]=L.R[O]; // 直 到 子 表 元 素 小 于 哨兵 ,将 哨兵 值 送 入 


// 当 前 要 插入 的 位 置 (包括 插入 到 表 首 ) 


} 


直接 插入 排序 算法 简单 ,容易 实现 ,是 一 种 稳定 的 排序 方法 ,只 需要 一 个 记录 大 小 的 
辅助 空间 用 于 存放 待 插入 的 记录 (在 C 语言 中 ,我 们 利用 了 数组 中 的 0 单元 ) 和 两 个 int 
型 变量 。 当 待 排序 记录 较 少 时 ,排序 速度 较 快 ,但 是 , 当 待 排序 的 记录 数量 较 大 时 ,大 量 的 
比较 和 移动 操作 将 使 直接 插入 排序 算法 的 效率 降低 ;然而 , 当 待 排序 的 数据 元 素 基 本 有 序 
时 ,直接 插入 排序 过 程 中 的 移动 次 数 大 大 减少 ,从 而 效率 会 有 所 提高 。 


3. 算法 分 析 


(1) 最 好 情况 : 若 待 排 序 记录 按 关键 字 从 小 到 大 排列 ( 正 序 ) ,算法 中 的 内 循环 无 须 
执行 , 则 一 趟 排序 时 : 关键 字 比 较 次 数 1 次 ,记录 不 需要 移动 , 则 整个 排序 的 关键 字 比 较 
次 数 为 "一 1, 记 录 移 动 次 数 为 0。 

(2) 最 坏 情 况 : 若 待 排序 记录 按 关键 字 从 大 到 小 排列 (逆序 ) , 则 一 趟 排序 时 : 算法 中 
的 内 循环 体 执行 i 一 1 次 ,关键 字 比 较 i 次 ,记录 移动 ;十 1 次 。 则 就 整个 排序 而 言 ,比较 次 
数 为 (n 十 2) (n 一 1)/2, 移 动 次 数 为 (n 十 4) (n 一 1)/2。 一 般 地 ,认为 待 排 序 的 记录 可 能 出 
现 的 各 种 排列 的 概率 相同 , 则 取 以 上 两 种 情况 的 平均 值 , 作 为 排序 的 关键 字 比 较 次 数 和 记 


一 放 


录 移 动 次 数 , 约 为 w*/4。 由 此 ,直接 插入 排序 的 时 间 复 杂 度 为 OO ) 。 
8.2.2 希 尔 排序 


1. 基本 思想 


希 尔 排序 (Shell Sort) 又 称 缩小 增 量 法 ,是 一 种 分 组 插入 排序 方法 。 其 基本 思想 是 将 
待 排序 的 记录 划分 成 几 组 ,从 而 减少 参与 直接 插入 排序 的 数据 量 , 当 经 过 几 次 分 组 排序 
后 ,记录 的 排列 已 经 基本 有 序 ,这 个 时 候 再 对 所 有 的 记录 实施 直接 插入 排序 。 

具体 步骤 可 以 描述 如 下 : @ 先 取 一 个 正 整 数 由 (d <n) 作 为 第 一 个 增 量 , 将 全 部 个 
记录 分 成 di 组 ,把 所 有 相隔 di 的 记录 放 在 一 组 中 , 即 对 于 每 个 k(k=1, 2,*…,di)， 
R[k], RLdi 十 k]，R[L2d1 十 k],，… 分 在 同一 组 中 ,在 各 组 内 进行 直接 插入 排序 。 这 样 的 
一 次 分 组 和 排序 过 程 称 为 一 赵 希 尔 排序 ; @ 取 新 的 增 量 d; 一 di ,重复 的 分 组 和 排序 操 
作 , 直 至 所 取 的 增 量 ;二 1 为 止 , 即 所 有 记录 放 进 一 个 组 中 排序 为 止 。 

例如 , 设 有 10 个 待 排序 的 记录 ,关键 字 分 别 为 9, 13, 8, 2,5, 13, 7, 1,，15，11 , 增 
量 序列 是 5, 3, 1, 希 尔 排 序 的 过 程 如 图 8. 2 所 示 。 


初始 关键 字 序 列 9 13 8 2 5 3 7 1 15 1 
| 
了 13 
让 
第 一 趟 排序 过 程 : 1 $ 
ss 
| 
第 一 趟 排序 后 : 9 7 1 2 5 B B3 8 15 11 
L 
第 二 趟 排序 后 : 2 5 1 9 7 B11 8 15 13 
第 三 趟 排序 后 : 1 2 5 7 8 9 1B 13 1 


图 8.2 和 希 尔 排序 过 程 


2. 算法 实现 


分 别 让 每 个 记录 参与 相应 分 组 中 的 排序 : 若 分 为 4 组 ,前 d 个 记录 就 应 该 分 别 构成 
由 一 个 记录 组 成 的 有 序 段 ,从 d 十 1 个 记录 开始 ,逐一 将 每 个 记录 R[ 站 插入 到 相应 组 中 的 
有 序 段 中 。 其 算法 可 以 如 下 实现 。 

先 给 出 一 趟 希 尔 排序 的 算法 ,类 似 直 接 插入 排序 。 


void ShellPass (Sqlist &L，int d) // 对 顺序 表 工 进行 一 趟 希 尔 排序 , 增 量 为 a 
t ,ny 
for (j=d+1; j<=L.1length; j++) 
t{ “五 天 [ji 下 下 全 1 // 设 置 监视 哨兵 
k=j-d; 
while(k>0&&LT(L-R[0] .key, L.R[Ik] .key) ) 
{ L.R[IK+d]=L.R[K]; k=k-d;} 
L.R[Ik+d]=L.R[0]; 
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} 
然后 再 根据 增 量 数组 dk 进行 希 尔 排序 。 


Void ShellSort (Sqlist &L，int dk[], int t+) 
// 按 增 量 序列 dk [0 … t-1], 对 顺序 表 工 进行 希 尔 排序 
{ intm; 
for (m=0; m<=t; m++) 
ShellPass(L, dk[m]); 
} 


3. 算法 分 析 


希 尔 排 序 是 一 种 不 稳定 的 排序 方法 。 希 尔 排序 时 效 分 析 很 难 , 关 键 字 的 比较 次 数 与 
记录 移动 次 数 依赖 于 步 长 因子 序列 的 选取 ,特定 情况 下 可 以 准确 估算 出 关键 字 的 比较 次 
数 和 记录 的 移动 次 数 。 目 前 还 没有 人 给 出 选取 最 好 步 长 因子 序列 的 方法 。 步 长 因子 序列 
可 以 有 各 种 取 法 ,有 取 奇 数 的 ,也 有 取 质 数 的 ,但 需要 注意 : 步 长 因子 中 除 1 外 没有 公 因 
子 , 且 最 后 一 个 步 长 因子 必须 取 1 。 

在 希 尔 排 序 中 ,由 于 开始 将 个 待 排序 的 记录 分 成 了 4d 组 ,所 以 每 组 中 的 记录 数目 将 
会 减少 。 在 数据 量 较 少 时 ,利用 直接 插入 排序 的 效率 较 高 。 随 着 反复 分 组 排序 ,d 值 逐 渐 
变 小 ,每 个 分 组 中 的 待 排序 记录 数目 将 会 增多 ,但 此 时 记录 的 排列 顺序 将 更 接近 有 序 , 所 
以 利用 直接 插入 排序 不 会 降低 排序 的 时 间 效率 。 希 尔 排序 适用 于 待 排序 的 记录 数目 较 大 
时 ,在 此 情况 下 , 希 尔 排序 方法 一 般 要 比 直接 插入 排序 方法 快 。 同 直接 插入 排序 一 样 , 希 
尔 排序 也 只 需要 一 个 记录 大 小 的 辅助 空间 ,用 于 和 暂 存 当 前 待 插入 的 记录 。 


8.3 ”交换 排序 


交换 排序 是 指 在 排序 过 程 中 ,主要 是 通过 待 排 序 记录 序列 中 元 素 间 关键 字 的 比较 ,与 
存储 位 置 的 交换 来 达到 排序 目的 的 一 类 排序 方法 ,其 中 最 基本 的 是 骨 泡 排序 。 


8.3.1 冒 泡 排序 


1. 基本 思想 


冒 泡 排序 (Bubble Sort) 是 交换 排序 中 一 种 简单 的 排序 方法 。 它 的 基本 思想 是 依次 
比较 相 邻 的 两 个 记录 的 关键 字 , 若 两 个 记录 是 反 序 的 ( 即 前 一 个 记录 的 关键 字 大 于 后 前 一 
个 记录 的 关键 字 ), 则 进行 交换 ,直到 没有 反 序 的 记录 为 止 , 最 终 达 到 有 序 化 。 其 处 理 过 程 
为 : 四 将 整个 待 排序 的 记录 序列 划分 成 有 序 区 和 无 序 区 ,初始 状态 有 序 区 为 空 ,无 序 区 包 
括 所 有 待 排序 的 记录 ; 四 对 无 序 区 从 前 向 后 依次 将 相 邻 记录 的 关键 字 进 行 比 较 , 若 逆序 
则 将 其 交换 ,从 而 使 得 关键 字 值 小 的 记录 向 上 “飘浮 ”( 左 移 ) ,关键 字 值 大 的 记录 好 像 石 


74 


块 ,向 下 “坠落 ”( 右 移 ); @ 每 经 过 一 趟 骨 泡 排序 ,都 使 无 序 区 中 关键 字 值 最 大 的 记录 进入 
有 序 区 ,对 于 由 个 记录 组 成 的 记录 序列 ,最 多 经 过 x 一 1 趟 冒 泡 排序 ,就 可 以 将 这 个 记 
录 重新 按 关 键 字 顺序 排列 。 

例如 , 设 有 9 个 待 排序 的 记录 ,关键 字 分 别 为 23, 38, 22, 45, 23, 67, 31, 15, 41, 冒 
泡 排 序 的 过 程 如 图 8. 3 所 示 。 


初始 关键 字 序 列 : 23 38 22 45 23 67 31 15 41 
第 一 趟 排序 后 : 23 22 38 23 45 31 15 41 67 
第 二 趟 排序 后 : 22 23 23 38 31 15 41 45 67 
第 三 趟 排序 后 : 23 23 31 15 38 41 45 67 
第 四 趟 排序 后 : 23 15 31 38 41 45 67 
第 五 趟 排序 后 : 22 23 15 23 31 38 41 45 67 
第 六 趟 排序 后 : 22 15 23 23 31 38 41 45 67 
第 七 趟 排序 后 : 15 22 23 23 31 38 41 45 67 
图 8.3 冒 泡 排序 过 程 


2. 算法 实现 


原始 的 冒 泡 排序 算法 是 : 对 由 n 个 记录 组 成 的 记录 序列 ,最 多 经 过 n 一 1 趟 冒 泡 排 
序 , 就 可 以 使 记录 序列 成 为 有 序 序列 ,第 一 趟 定位 第 个 记录 ,此 时 有 序 区 只 有 一 个 记录 ; 
第 二 趟 定位 第 ”一 1 个 记录 ,此 时 有 序 区 有 两 个 记录 ;以 此 类 推 。 在 冒 泡 排 序 过 程 中 ,一 旦 
发 现 某 一 趟 没有 进行 交换 操作 ,就 表明 此 时 待 排序 记录 序列 已 经 成 为 有 序 序列 , 冒 泡 排序 
再 进行 下 去 已 经 没有 必要 ,应 立即 结束 排序 过 程 。 改 进 的 冒 泡 排序 算法 如 下 。 


void BubbleSort (Sqlist &L) 


{ intj,k,flag; //flag 标记 是 否 在 某 趟 排序 中 没有 发 生 交 换 
for (j=0;j<L.length-1;j++) // 共 有 n-1 趟 排序 
{ flag=1; 
for (k=1;k<L.length-j;k++) // 一 趟 排序 
if (LT(L.R[kK+1] .key, L.R[k] .key)) 
{ flag=0; 


L.R[0]=L.R[K] ;L.R[k]=L.R[K+1];?L.R[k+1]=L.R[0]; } 
if (flag==1) break; 


} 


3. 算法 分 析 


冒 泡 排序 可 以 减少 比较 的 次 数 ,同时 也 减少 了 交换 的 次 数 。 最 好 时 间 性 能 接近 于 
O00) ,但 最 坏 时 间 性 能 仍 为 OG? ) ,所 以 平均 时 间 复 杂 性 为 OG)。 

冒 泡 排序 比较 简单 ,当初 始 序 列 基本 有 序 时 , 冒 泡 排 序 有 较 高 的 效率 ,反之 效率 较 低 ; 
其 次 , 冒 泡 排序 只 需要 一 个 记录 的 辅助 空间 ,用 来 作为 记录 交换 的 中 间 暂 存单 元 。 冒 泡 排 
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序 是 一 种 稳定 的 排序 方法 。 


8.3.2 快速 排序 


1. 基本 思想 


快速 排序 (Quick Sort) 又 称 为 分 区 交换 排序 。 其 基本 思想 是 : 通过 比较 关键 字 、 交 换 
记录 ,以 某 个 记录 为 界 (该 记录 称 为 支点 ) ,将 待 排序 记录 分 隔 成 独立 的 两 部 分 ,其 中 一 部 
分 所 有 记录 的 关键 字 大 于 等 于 支点 记录 的 关键 字 , 另 一 部 分 所 有 记录 的 关键 字 小 于 支点 
记录 的 关键 字 。 我 们 将 待 排序 记录 按 关键 字 以 支点 记录 分 成 两 部 分 的 过 程 , 称 为 一 次 划 
分 。 对 各 部 分 不 断 划分 ,直到 整个 序列 按 关 键 字 有 序 。 

这 种 方法 的 每 一 次 划分 都 要 把 排序 表 ( 或 子 表 ) 的 第 一 个 元 素 放 到 它 在 表 中 的 最 终 位 
置 ( 即 该 元 素 的 位 置 不 需要 再 进行 交换 )。 同 时 在 这 个 元 素 的 前 面 和 后 面 各 形成 一 个 子 
表 , 在 前 子 表 中 的 所 有 元 素 的 关键 字 都 比 该 元 素 的 关键 字 小 ,而 在 后 子 表 中 的 都 比 它 大 。 
此 后 再 对 每 个 子 表 做 同样 步骤 的 操作 ,直到 最 后 每 个 子 表 都 只 有 一 个 元 素 ,排序 完成 。 

例如 , 设 有 7 个 待 排 序 的 记录 ,关键 字 分 别 为 29,38,22,45,23,67,31, 一 趟 快速 排序 
的 过 程 如 图 8. 4 所 示 。 


0 

初始 关键 字 序列 : 29 29 38 22 45 23 67 31 
1 1 

/前 移 两 个 位 置 后 ， 29 > 7 

及 四 放 R 因 的 位 置 : 加 人 弹 2 1 S03 
i 2 

i 后 移 一 个 位 置 后 ，。 29 > 7 

RR 国 放 RR 的 位 置 : 3 及 1 2 于 3 

i 了 
j 前 移 两 个 位 置 后 ， 29 23 22 45 38 67 31 


四 放 RI] 的 位 置 : 
喇 前 移 一 个 位 置 后 29 23 22 2 
i 和 j 的 位 置 重 合 : sti tt 

" 


图 8.4 一 次 快速 排序 过 程 


45 38 67. 31 


2. 算法 实现 


快速 排序 是 一 个 递归 的 过 程 ,只 要 能 够 实现 一 趟 快速 排序 的 算法 ,就 可 以 利用 递归 的 
方法 对 一 趟 快速 排序 后 的 左右 分 区 域 分 别 进行 快速 排序 。 

设 待 排序 的 记录 序列 是 RLs…j, 在 记录 序列 中 任 取 一 个 记录 (一 般 取 RLs]) 作 为 参 
照 ( 又 称 为 基准 或 枢 轴 ) ,以 RLs]. key 为 基准 重新 排列 其 余 的 所 有 记录 ,方法 是 : 所 有 
关键 字 比 基准 小 的 放 在 RLsj 之 前 ; @ 所 有 关键 字 比 基准 大 的 放 在 RLsj 之 后 。 以 RLs]. 
key 最 后 所 在 位 置 i 作为 分 界 , 将 序列 RLs… 分 成 两 个 子 序列 , 称 为 一 趟 快速 排序 。 

一 趟 快速 排序 方法 是 从 序列 的 两 端 交替 扫描 各 个 记录 ,将 关键 字 小 于 基准 关键 字 的 
记录 依次 放置 到 序列 的 前 边 ; 而 将 关键 字 大 于 基准 关键 字 的 记录 从 序列 的 最 后 端 起 ,依次 
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放置 到 序列 的 后 边 , 直 到 扫描 完 所 有 的 记录 。 设 置 指针 low 和 high, 其 初 值 分 别 为 第 一 
个 和 最 后 一 个 记录 的 位 置 。 设 两 个 变量 ij ,初始 时 令 i 二 low,j 一 high, 以 R[lowj. key 
作为 基准 (将 RLlow] 保 存在 RL0] 中 ) 。@ 从 了 所 指 位 置 向 前 搜索 : 将 RL0J]. key 与 
R[j]. key 进行 比较 , 若 RL0J]. key 过 RL[j]. key, 令 j 二 j 一 1, 然 后 继续 进行 比较 ,直到 i 二 j 
或 RL0J]. keyRLj]. key 为 止 ; 若 RLO]. key 这 RD. key,RLjj] 过 R[ 疏 ,腾空 RL] 的 位 置 ， 
且 令 i=i 十 1。@ 从 i 所 指 位置 起 向 后 搜索 : 将 RL0]. key 与 R[ 门 . key 进行 比较 , 若 
R[0]. key 之 R[ 记 . key, 令 ;一 ;十 1, 然 后 继续 进行 比较 ,直到 ;一 ) 或 RL0]. key<<R[i]. key 
为 止 ; 若 R[0]. key 过 R[]. key,R[i] 过 RLj] ,腾空 R[ 门 的 位 置 , 且 令 j==j 一 1。@ 重 复 、 
@, 直 至 i=j 为 止 ,i 就 是 RL0]( 基 准 ) 所 应 放置 的 位 置 。 
(1) 一 趟 快速 排序 算法 的 实现 算法 如 下 。 


int QuickOnePass (Sqlist gL, int low, int high) 
{ int i=low, j=high; 
Bb.RIO)=L:RIEl //R[0] 作 为 临时 单元 和 哨兵 
do 
{ while (LQ(L.R[0] .key, L.R[j] .key)&& (j>i)) 
== 
if (j>i) { L.R[i]=L.R[j] ; i++; } 
while (LQ(L.R[i].key, L.R[0] .key)&&(j>i)) 
i++? 
if (j>i) {LL.R[j]=L.R[i] ; j--;} 
} while (i!=j); //i=j 时 退出 扫描 
L.R[i]=L.R[0]; 
return (i); 


} 


(2) 快速 排序 算法 实现 。 

当 进 行 一 趟 快速 排序 后 ,采用 同样 方法 分 别 对 两 个 子 序列 快速 排序 ,直到 子 序列 记录 
个 数 为 1 为 止 。 

@ 递归 算法 。 


void QuickSort (Sqlist gL, int low, int high) 
(， nt 攻 省 
if (low<high) { 
k=QuickonePass (L, low, high); 
QuickSsort(L, low, Kk-1); 
Quicksort(L, k+l1, high); 
} // 序 列 分 为 两 部 分 后 分 别 对 每 个 子 序列 排序 
} 


@ 非 递归 算法 。 


#define MAX STACK 100 
void QuickSort (Sqlist &L, int low, int high) 
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int k, stack[MAX STACK], top=0; 
do { while (low<high) 
{ k=QuickOnePass (L,low,high); 
stack[++top]=high ; stack[++top]=k+1; 
// 第 二 个 子 序列 的 上 、 下 界 分 别 入 栈 
high=k-1; 
} 
if (top!=0) 
{ LIow=stack[top--] ; high=stack[top--];} 
}while (top!=0&&low<high) ; 
} 


3. 算法 分 析 


快速 排序 实质 上 是 对 冒 泡 排序 的 一 种 改进 , 它 的 效率 与 冒 泡 排序 相 比 有 很 大 的 提高 。 
在 冒 泡 排序 过 程 中 是 对 相 邻 两 个 记录 进行 关键 字 比 较 和 互 换 的 ,这 样 每 次 交换 记录 后 ,只 
能 改变 一 对 逆序 记录 ,而 快速 排序 则 从 待 排序 记录 的 两 端 开 始 进行 比较 和 交换 ,并 逐渐 向 
中 间 靠 拢 ,每 经 过 一 次 交换 ,有 可 能 改变 几 对 逆序 记录 ,从 而 加 快 了 排序 速度 。 到 目前 为 
止 ,快速 排序 是 平均 速度 最 快 的 一 种 排序 方法 ,但 当 原 始 记录 排列 基本 有 序 或 基本 逆序 
时 ,每 一 趟 的 基准 记录 有 可 能 只 将 其 余 记录 分 成 一 部 分 ,这 样 就 降低 了 时 间 效 率 , 所 以 快 
速 排序 适用 于 原始 记录 排列 杂乱 无 章 的 情况 。 

快速 排序 的 主要 时 间 是 花费 在 划分 上 ,是 一 种 不 稳定 的 排序 ,在 递归 调用 时 需要 占据 
一 定 的 存储 空间 用 来 保存 每 一 层 递 归 调用 时 的 必要 信息 。 快 速 排序 的 平均 时 间 复 杂 度 是 
T(n) 二 O(nlogzn) ,空间 复杂 度 是 S(n) 二 O(logzn)。 


8.4 选择 排序 

选择 排序 (Selection Sorb 主要 是 每 次 从 当前 待 排序 的 记录 中 选取 关键 字 最 小 的 记 
录 , 然 后 与 待 排序 的 记录 序列 中 的 第 一 个 记录 进行 交换 ,直到 整个 记录 序列 有 序 为 止 。 

1. 基本 思想 


下 面 介绍 一 种 简单 的 选择 排序 (又 称 为 直接 选择 排序 ) ,基本 操作 是 : 第 一 趟 ,从 个 
初始 记录 的 关键 字 ，7 4 -2 19 13 6 记录 中 找 出 关键 字 最 小 的 记录 与 第 一 个 记录 交 
第 一 趟 排序 ，-2 4 7 19 13 6 换 ; 第 二 趟 ,从 第 二 个 记录 开始 的 2 一 1 个 记录 中 


第 二 趟 排序 ，-2 4 7 19 13 6 再 选 出 关键 字 最 小 的 记录 与 第 二 个 记录 交换 ;以 
第 三 趟 排序 ， -2 4 6 19 13 7 此 类 推 ,第 ;i 趟 , 则 从 第 i 个 记录 开始 的 2 一 ;十 1 
第 四 趟 排序 ，-2 4 6 7 13 19 个 记录 中 选 出 关键 字 最 小 的 记录 ,然后 和 第 i 个 
第 五 趟 排序 ， - 记录 进行 交换 ,直到 整个 序列 按 关键 字 有 序 。 


bb 
a 
CS 
站 
[mo 
= 


第 六 趟 排序 : 2 4 6 7 13 19 例如 , 设 有 关键 字 序 列 为 7,4, 一 2,19,13,6， 
图 8.5 直接 选择 排序 的 过 程 直接 选择 排序 的 过 程 如 图 8. 5 所 示 。 
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2. 算法 实现 


void SimpleSelectionSort (Sqlist &L) 
下 
for (m=1; m<L.length; m++) 
{ k=m; 
for (n=m+1; n<=L.length; n++) 
if (LT(L.R[n] .key, L.R[k] .key) ) k=n; 
if (k!=m) // 记 录 交 换 
{ L.R[0]=L.R[m]; L.R[Im]=L.R[kK]; 
L.R[kK]=L.R[0]; 
} 


} 


3. 算法 分 析 


从 算法 可 以 看 出 ,无 论 如 何 , 比 较 的 次 数 是 固定 不 变 的 ,为 n(n 一 1)/2, 即 时 间 复 杂 度 
是 OG)。 移 动 的 次 数 与 关键 字 值 有 关 , 若 记录 序列 是 基本 有 序 的 , 则 移动 次 数 接近 于 0， 
即 空间 复杂 度 是 O(1) 。 简 单 选择 排序 算法 简单 ,但 是 速度 较 慢 ,并 且 是 一 种 不 稳定 的 排 
序 方法 ,但 在 排序 过 程 中 只 需要 一 个 用 来 交换 记录 的 暂 存单 元 。 


8.5 ”归并 排序 


1. 基本 思想 


归并 排序 (Merging Sort) 是 另 一 类 不 同 的 排序 方法 。 所 谓 归 并 是 指 将 两 个 或 两 个 以 上 
的 有 序 序 列 合并 成 一 个 新 的 有 序 序列 。 比 如 两 堆 扑 克 牌 ,都 已 按 从 小 到 大 排 好 序 ,要 将 两 堆 
合并 为 一 堆 有 旦 要求 从 小 到 大 排序 。 归 并 排序 的 基本 思想 是 将 一 个 具有 个 待 排 序 记 录 的 序 
列 看 成 是 个 长 度 为 1 的 有 序 序列 ,然后 进行 两 两 归并 ,得 到 /2 个 长 度 为 2 的 有 序 序列 ， 
再 进行 两 两 归并 ,得 到 n/4 个 长 度 为 4 的 有 序 序列 ,如 此 重复 ,直至 得 到 一 个 长 度 为 n 的 有 
序 序列 为 止 。 通 常 , 我 们 将 两 个 有 序 段 合并 成 一 个 有 序 段 的 过 程 称 为 2- 路 归并 。 

例如 , 设 有 关键 字 序列 为 23,38,22,45,23,67,31,15,41, 归 并 排序 的 过 程 如 图 8.6 所 示 。 


初始 关键 字 [23] By Bal [45] [3] [On BI 0 外 
T T T [ 

第 一 趟 归并 后 : [23 38] [2 45] [23 67 05 31] [41] 
第 二 趟 归并 后 : [22 23 38 4] [15 23 31 67] [41] 
RE | 

第 三 趟 归并 后 : [15 22 23 23 31 38 4 67] [41] 
人 

第 四 趟 归并 后 : [15 22 23 2 31 38 4 4 67 


图 8.6 归并 排序 过 程 


79 


-一 80 


数据 结构 与 数据 库 应 用 教程 


2. 算法 实现 
2- 路 归并 排序 算法 实现 如 下 。 


Void Merge (RecType R[], RecType DR[], int k, int m, int h) 
{ int p, q, n ; p=n=Kk, q=m+1; 
while ((p<=m)&& (q<=h)) 
{ if (LQ(R[Ip] .key, RIq] .key) ) // 比 较 两 个 子 序列 
DR[In++]=R[p++] ; 
else DR[n++]=R[q++] ; 
} 
while (p<=m) // 将 剩余 子 序列 复制 到 结果 序列 中 
DR [n++]=RIP++] 7? 
while (q<=h) DR[n++]=RIgq++] 7 
} 


一 赵 归 并 排序 都 是 从 前 到 后 ,依次 将 相 邻 的 两 个 有 序 子 序列 归并 为 一 个 , 且 除 最 后 一 
个 子 序列 外 ,其 余 每 个 子 序列 的 长 度 都 相同 。 设 这 些 子 序列 的 长 度 为 4, 则 一 趟 归并 排序 
的 过 程 是 : 从 j 二 1 开始 ,依次 将 相 邻 的 两 个 有 序 子 序列 RLj…j 十 d-1] 和 RL 十 d*…j 十 
2d-1] 进 行 归并 ;每 次 归并 两 个 子 序列 后 ,j 向 后 移动 24 个 位 置 , 即 j=j 十 2d; 若 剩 下 的 元 
素 不 足 两 个 子 序 列 时 ,分 为 以 下 两 种 情况 处 理 : 车 剩 下 的 元 素 个 数 二 d, 再 调用 一 次 上 
述 过 程 ,将 一 个 长 度 为 d 的 子 序列 和 长 度 不 足 d 的 子 序列 进行 归并 ; @ 若 剩 下 的 元 素 个 
数 迄 d ,将 剩 下 的 元 素 依次 复制 到 归并 后 的 序列 中 。 

1) 一 趟 归并 排序 算法 


void MergePass (RecType R[], RecType DR[], int d，int n) 
{ intj=1; 

while ((j+2*d-1)<=n) 

{ Mergel(R, DR, j, j+d-1, j+2*d-1); 


j=j+2*d; 

} // 子 序列 两 两 归并 

if (j+d-1<n) // 剩 余 元 素 个 数 超过 一 个 子 序列 长 度 a 
Merge (R, DR, j, j+d-1, n); 

else Merge(R, DR, j, ns, n); // 剩 余子 序列 复制 


} 


2) 归并 排序 的 算法 
开始 归并 时 ,每 个 记录 是 长 度 为 1 的 有 序 子 序列 ,对 这 些 有 序 子 序列 逐 趟 归并 ,每 一 
趟 归并 后 有 序 子 序列 的 长 度 均 扩 大 一 倍 ; 当 有 序 子 序 列 的 长 度 与 整个 记录 序列 长 度 相等 
时 ,整个 记录 序列 就 成 为 有 序 序列 。 算 法 如 下 。 
void MergeSort (Sqlist gL, RecType DR[]) 
{ intd=1; 
while(d<L.1length) 


{ MergePass(L.R, DR, d, 工 . length) 7 
MergePass(DR, L.R, 2*d, L.length); 


d=4*d; 
} 


3. 算法 分 析 


有 具有 个 待 排序 记录 的 序列 的 归并 次 数 是 logzn, 而 一 赵 归 并 的 时 间 复 杂 度 为 O(n)， 
则 整个 归并 排序 的 时 间 复 杂 度 无 论 是 最 好 还 是 最 坏 情况 均 为 O(nlogzn)。 在 排序 过 程 
中 ,使 用 了 辅助 向 量 DR, 大 小 与 待 排 序 记录 空间 相同 , 则 空间 复杂 度 为 O(n)。 归 并 排序 
是 稳定 的 。 

2- 路 归并 排序 的 递归 算法 从 程序 的 书写 形式 上 看 比较 简单 ,但 是 在 算法 执行 时 , 需 
要 占用 较 多 的 辅助 存储 空间 , 即 除 了 在 递归 调用 时 需要 保存 一 些 必要 的 信息 外 ,在 归并 过 
程 中 还 需要 与 存放 原始 记录 序列 同样 数量 的 存储 空间 ,以 便 存 放 归 并 结果 ,但 与 快速 排序 
相 比 , 它 是 一 种 稳定 的 排序 方法 。 


小 结 


本 章 主 要 介绍 各 种 排序 方法 的 基本 思路 .算法 实现 及 性 能 分 析 方法 。 

(1) 插入 排序 : 依次 将 无 序 序列 中 的 一 个 记录 , 按 关键 字 值 的 大 小 插入 到 已 排 好 序 
的 一 个 子 序列 的 适当 位 置 , 直 到 所 有 的 记录 都 插入 为 止 。 具 体 的 方法 有 : 直接 插入 排序 ， 
和 希 尔 排序 。 

(2) 交换 排序 : 对 于 待 排序 记录 序列 中 的 记录 ,两 两 比较 记录 的 关键 字 , 并 对 反 序 的 
两 个 记录 进行 交换 ,直到 整个 序列 中 没有 反 序 的 记录 偶 对 为 止 。 具 体 的 方法 有 : 冒 泡 排 
序 、 快 速 排序 。 

(3) 选择 排序 : 不 断 地 从 待 排序 的 记录 序列 中 选取 关键 字 最 小 的 记录 , 放 在 已 排 好 
序 的 序列 的 最 后 ,直到 所 有 记录 都 被 选取 为 止 。 

(4) 归并 排序 : 利用 “归并 ”技术 不 断 地 对 待 排序 记录 序列 中 的 有 序 子 序列 进行 合 
并 ,直到 合并 为 一 个 有 序 序列 为 止 。 

各 种 内 部 排序 方法 的 性 能 比较 如 表 8. 1 所 示 。 


表 8.1 内 部 排序 方法 性 能 比较 


方法 平均 时 间 最 坏 所 需 时 间 附加 空间 稳定 性 
直接 插入 排序 OO2 ) On) O00) 稳定 的 
希 尔 排 序 OGa3) O01) 不 稳定 的 
冒 泡 排序 On’) On) O00) 稳定 的 
快速 排序 O(nlogsn) OCz ) O(logsn) 不 稳定 的 
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续 表 

方法 平均 时 间 最 坏 所 需 时 间 附加 空间 稳定 性 

选择 排序 On) OOz ) O(1) 不 稳定 的 
归并 排序 Onlogsn) Onlogsn) OO 稳定 的 


习题 


8.1 有 一 组 关键 字 序列 (46,74,53,14,26,38,86,65,27,34), 写 出 用 下 列 排 序 法 进 
行 升序 排序 的 每 趟 排序 的 结果 。 

(1) 直接 插入 排序 法 ; 

(2) 冒 泡 排序 法 ; 

(3) 快速 排序 法 ; 

(4) 选择 排序 法 ; 

(5) 归并 排序 法 。 
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第 二 部 分 “数据库 技 术 


第 9 章 数据 库 系 统 概述 


本 章 学 习 目标 
。 了 解数 据 库 发 展 的 背景 。 
。 掌握 数据 库 技术 术语 、 数 据 库 系统 体系 结构 。 
。 理解 常见 的 数据 模型 ,主要 是 关系 模型 的 结构 和 约束 条 件 。 


随 着 人 类 社会 的 不 断 发 展 和 进步 ,需要 处 理 的 数据 量 越 来 越 大 ,如 何 对 大 量 的 数据 进 
行 存储 ,加工 、 传 输 和 使 用 ,已 日 益 受 到 人 们 的 广泛 重视 。 数 据 库 技术 就 是 在 这 种 形式 下 
产生 并 发 展 的 。 现 在 数据 库 已 是 各 项 业务 的 基础 ,例如 ,数据 库 被 应 用 于 维护 商业 内 部 记 
录 , 在 万 维 网 上 为 顾客 和 客户 显示 数据 ,以 及 支持 很 多 其 他 商业 处 理 。 数 据 库 同 样 出 现在 
很 多 科学 研究 中 ,天 文学 家 、 地 理学 家 以 及 其 他 很 多 科学 家 搜集 的 数据 也 是 用 数据 库 表 示 
的 。 此 外 ,数据 库 也 用 在 企业 ,行政 部 门 。 因 此 ,数据 库 技术 已 成 为 当今 计算 机 信息 系统 
的 核心 技术 ,是 计算 机 技术 和 应 用 发 展 的 基础 。 经 过 几 十 年 的 发 展 ,数据 库 技术 已 形成 了 
较为 完整 的 理论 体系 和 实用 技术 。 本 章 主要 介绍 数据 库 技术 的 发 展 和 数据 库 系 统 涉及 的 
最 基本 、 最 重要 的 概念 ,包括 数据 模型 .数据库 管理 系统 .数据库 系统 的 组 成 等 。 


9.1 数据 库 系统 的 作用 


9.1.1 数据 与 数据 管理 


在 介绍 数据 库 的 基本 概念 之 前 ,本 节 先 介绍 一 些 数据 库 常 用 的 术语 和 基本 概念 。 
1. 数据 


描述 事物 的 符号 称 为 数据 (Data) ,如 数值 数据 、 文 本 数据 和 多 媒体 数据 (如 图 形 、 图 
像 音 频 和 视频 ) 等 。 用 数据 描述 的 现实 世界 中 的 对 象 可 以 是 实在 的 事物 ,如 一 个 学 生 的 
情况 可 用 学 号 姓名、 性 别 、 年 龄 、 系 别 、 入 学 时 间 等 描述 : 


(201823102, 赵 文 , 男 ,18, 计 算 机 专业 ,2018) 


这 里 的 学 生 记 录 就 是 数据 。 对 于 这 条 记录 ,了 解 其 含义 后 将 得 到 如 下 信息 : 赵 文 是 
个 大 学 生 , 男 ,今年 18 岁 ,2018 年 考 人 计算 机 专业 ,而 不 了 解 含义 的 人 则 无 法 理解 其 描 
述 。 可 见 ,数据 形式 本 身 还 不 能 完全 表达 其 内 容 ,需要 经 过 语义 解释 。 因 此 数据 和 关于 数 
据 的 解释 是 不 可 分 的 ,数据 的 解释 是 对 数据 含义 的 说 明 ,数据 的 含义 称 为 数据 的 语义 , 数 
据 与 其 语义 是 不 可 分 的 。 
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2. 数据 库 


数据 库 (DataBase,DB) 是 长 期 存储 在 计算 机 内 有 组 织 的 共享 的 数据 的 集合 。 数 据 库 
中 的 数据 按 一 定 的 数据 模型 组 织 .描述 和 储存 。 它 可 以 供用 户 共享 ,具有 尽 可 能 小 的 宛 余 
度 和 较 高 的 数据 独立 性 ,使 得 数据 存储 最 优 ,数据 容易 操作 ,并 且 具 有 完善 的 自我 保护 能 
力 和 数据 恢复 能 力 。 数 据 库 的 特点 如 下 。 

1) 集成 性 

数据 库 把 某 特定 应 用 环境 中 的 各 种 应 用 相关 的 数据 及 其 数据 之 间 的 联系 全 部 集中 地 
按照 一 定 的 结构 形式 进行 存储 ,或 者 说 ,把 数据 库 看 成 若干 个 性 质 不 同 的 数据 文件 的 联合 
和 统一 的 数据 整体 。 数 据 集 中 存放 的 好 处 是 : 一 个 数据 只 需 一 个 备份 ,重复 存储 少 , 即 消 
除了 数据 的 元 余 。 没 有 数据 元 余 , 也 就 能 保证 数据 的 一 致 。 

2) 共享 性 

数据 库 中 的 一 块 块 数据 可 为 多 个 不 同 的 用 户 所 共享 , 即 多 个 不 同 的 用 户 ,使 用 多 种 不 
同 的 语言 ,为 了 不 同 的 应 用 目的 ,而 同时 存 取 数 据 库 ,甚至 同时 存 取 同 一 块 数据 , 即 多 用 户 


3. 数据 库 管理 系统 


数据 库 管 理 系 统 (DataBase Management System,DBMS) 是 位 于 用 户 与 操作 系统 之 
间 的 一 层 数据 管理 软件 , 它 是 数据 库 系 统 的 核心 组 成 部 分 ,用 户 在 数据 库 系 统 中 的 一 切 操 
作 , 包 括 数据 定义 ,查询 .更 新 及 各 种 控制 ,都 是 通过 DBMS 进行 的 。DBMS 就 是 实现 把 
用 户 意义 下 的 抽象 的 逻辑 数据 处 理 转换 成 计算 机 中 的 具体 的 物理 数据 的 处 理 软件 ,这 给 
用 户 带 来 很 大 的 方便 。 

数据 库 管理 系统 是 数据 库 系 统 的 核心 ,是 管理 数据 库 的 软件 。 有 了 数据 库 管理 系统 ， 
用 户 就 可 以 在 抽象 意义 下 处 理 数据 ,而 不 必 顾 及 这 些 数据 在 计算 机 中 的 布局 和 物理 位 置 。 


4. 数据 库 系 统 


数据 库 系 统 (DataBase System,DBS) 是 指 在 计算 机 系统 中 引入 数据 库 后 的 系统 ,一 
般 由 数据 库 数据库 管 理 系 统 ( 及 其 开发 工具 )、 应 用 系统 数据 库 管理 员 和 用 户 构 成 ,如 
图 9.1 所 示 。 

在 不 引起 混淆 的 情况 下 ,常常 把 数据 库 系 统 简 称 为 数据 库 。 数 据 库 系统 在 整个 计算 
机 系统 中 的 地 位 如 图 9. 2 所 示 。 数 据 库 应 用 系统 是 指 系统 开发 人 员 利用 数据 库 系 统 资源 
开发 出 来 的 ,面向 某 一 类 实际 应 用 的 应 用 软件 系统 ,例如 财务 管理 系统 .人 事 管理 系统 等 。 
应 用 开发 工具 软件 有 VC、VB、C++ JSP.Delphi 等 。DBMS 有 Oracle、SQL Server、DB2、 
Sybase、Access 等 。 


5. 用 户 


用 户 (User) 是 指使 用 数据 库 的 人 , 即 对 数据 库 进行 存储 、 维 护 和 检索 等 操作 的 人 。 
用 户 大 致 可 分 为 终端 用 户 、 应 用 程序 员 和 数据 库 管 理 员 。 
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应 用 系统 


数据 库 管理 员 


图 9.1 数据 库 系 统 各 组 成 成 分 的 关系 图 9.2 数据 库 系 统 在 计算 机 系统 中 的 地 位 


1) 终端 用 户 

终端 用 户 (End User) 主 要 是 指使 用 数据 库 的 各 级 管理 人 员 ,工程 技术 人 员 、 科 研 人 
员 ,一 般 为 非 计算 机 专业 人 员 。 

2) 应 用 程序 员 

应 用 程序 员 负 责 为 终端 用 户 设计 和 编制 应 用 程序 ,以 便 终端 用 户 对 数据 库 进 行 存 取 
操作 。 

3) 系统 分 析 员 和 数据 库 设计 人 员 

系统 分 析 员 负责 应 用 系统 的 需求 分 析 和 规范 说 明 ,要 和 用 户 及 DBA 相 结合 ,确定 系 
统 的 软 硬 件 配置 ,并 参与 数据 库 系 统 的 概要 设计 。 数 据 库 设计 人 员 负 责 数据 库 中 数据 的 
确定 ,数据库 各 级 模式 的 设计 。 数 据 库 设计 人 员 必 须 参加 用 户 需求 调查 和 系统 分 析 ,然后 
进行 数据 库 设 计 。 在 很 多 情况 下 ,数据 库 设 计 人 员 由 数据 库 管理 员 担任 。 

4) 数据 库 管理 员 

在 数据 库 系统 环境 下 ,有 两 类 共享 资源 ,一 类 是 数据 库 , 另 一 类 是 数据 库 管理 系统 软 
件 。 因 此 需要 有 专门 的 管理 机 构 来 监督 和 管理 数据 库 系 统 。 数 据 库 管理 员 (DataBase 
Administrator,DBA) 则 是 这 个 机 构 的 一 个 (组 ) 人 员 ,负责 全 面 管理 和 控制 数据 库 系 统 。 
DBA 应 自始至终 参加 整个 数据 库 系统 的 研制 开发 工作 ,开发 成 功 后 ,DBA 将 全 面 负责 
据 库 系统 的 管理 .维护 和 正常 使 用 。 其 职责 如 下 。 

(1) 参与 数据 库 设 计 的 全 过 程 ,决定 数据 库 的 结构 和 内 容 。 

(2) 定义 数据 的 安全 性 和 完整 性 ,负责 分 配 用 户 对 数据 库 的 使 用 权限 和 口令 管理 。 

(3) 监督 控制 数据 库 的 使 用 和 运行 ,改进 和 重新 构造 数据 库 系统 。 当 数据 库 受 到 破 
坏 时 ,应 负责 恢复 数据 库 ; 当 数据 库 的 结构 需要 改变 时 ,完成 对 数据 库 结 构 的 修改 。 

因此 ,DBA 不 仅 要 有 较 高 的 技术 专长 和 较 深 的 资历 ,并 应 具有 了 人 解 和 阐明 管理 要 求 
的 能 力 。 特 别 对 于 大 型 数据 库 系 统 ,DBA 极为 重要 。 对 于 常见 的 微机 数据 库 系统 ,通常 
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只 有 一 个 用 户 ,常常 不 设 DBA ,其 职责 由 应 用 程序 员 或 终端 用 户 代替 。 


9.1.2 数据 库 应 用 


数据 库 技术 作为 现代 信息 技术 的 重要 组 成 部 分 ,伴随 着 计算 机 应 用 技术 的 迅速 发 展 ， 
在 数据 库 技术 的 基础 理论 .数据库 设计 方法 、 数 据 库 应 用 开发 等 方面 都 得 到 了 长 足 的 发 
展 。 设 计数 据 库 系统 的 目的 是 为 了 管理 大 量 信息 。 对 数据 的 管理 既 涉及 信息 存储 结构 的 
定义 ,又 涉及 信息 操作 机 制 的 提供 。 此 外 ,数据 库 系 统 还 必须 提供 所 存储 信息 的 安全 保 
证 ,即使 在 系统 崩溃 或 有 人 企图 越权 访问 时 也 应 保障 信息 的 安全 性 。 如 果 数 据 将 被 多 个 
用 户 共 享 ,那么 系统 还 必须 设法 避免 可 能 产生 的 异常 结果 。 


1. 数据 库 系统 的 应 用 


数据 库 的 应 用 非常 广泛 ,以 下 是 一 些 具有 代表 性 的 应 用 。 

(1) 银行 业 : 用 于 存储 客户 的 信息 ,账户 、 贷 款 以 及 银行 的 交易 记录 。 

(2) 航空 业 : 用 于 存储 订 票 和 航班 的 信息 。 航 空 业 是 最 先 以 地 理 上 分 布 的 方式 使 用 
数据 库 的 行业 之 一 。 

(3) 大 学 : 用 于 存储 学 生 的 学 籍 . 课 程 和 成 绩 等 信息 。 

(4) 信用 卡 交易 : 用 于 记录 信用 卡 消费 的 情况 和 产生 每 月 清单 。 

(5) 电信 业 : 用 于 存储 通话 记录 ,产生 每 月 账单 ,维护 预付 电话 卡 的 余额 和 存储 通信 
网 络 的 信息 。 

(6) 金融 业 : 用 于 存储 股票 .债券 等 金融 票据 的 持 有 、 出 售 和 买 人 信息 ;也 可 用 于 存 
储 实时 的 市 场 数据 ,以 便 客 户 能 够 进行 联机 交易 ,公司 能 够 进行 自动 交易 。 

(7) 销售 业 : 用 于 存储 客户 .产品 及 购买 信息 。 

(8) 联机 的 零售 商 : 用 于 存储 销售 数据 ,以 及 实时 的 订单 跟踪 ,推荐 品 清单 的 生成 ， 
还 有 实时 的 产品 评估 的 维护 。 

(9) 制造 业 : 用 于 管理 供应 链 ,跟踪 工厂 中 产品 的 生产 情况 、 仓 库 和 商店 中 产品 的 详 
细 清 单 以 及 产品 的 订单 。 

(10) 人 力 资源 : 用 于 存储 雇员 工资 ,所得税 和 津贴 的 信息 ,以 及 产生 工资 单 。 

正如 以 上 所 列举 的 ,数据 库 已 经 成 为 当今 几乎 所 有 企业 不 可 缺少 的 组 成 部 分 。 

在 20 世纪 最 后 的 40 年 中 ,数据 库 的 使 用 在 所 有 的 企业 中 都 有 所 增长 。 在 早期 ,很 少 
有 人 直接 和 数据 库 系统 打交道 ,尽管 没有 意识 到 这 一 点 ,他 们 还 是 与 数据 库 间接 地 产生 联 
系 ,例如 ,通过 打印 的 报表 (如 信用 卡 的 对 账单 ) 或 者 通过 代理 (如 银行 的 出 纳 员 和 机 票 预 
订 代 理 等 ) 间 接 与 数据 库 发 生 关系 。 自 动 取款 机 的 出 现 ,使 用 户 可 以 直接 和 数据 库 进 行 交 
互 。 计 算 机 的 电话 界面 (交互 式 语音 应 答 系 统 ) 也 使 得 用 户 可 以 直接 和 数据 库 进 行 交互 ， 
访问 者 可 以 通过 拨号 和 按 电话 键 来 输入 信息 或 选择 可 选项 ,来 找 出 如 航班 的 起 降 时 间 ,或 
注册 学 校 的 课程 等 。 

20 世纪 90 年 代 末 ,互联 网 革命 急剧 地 增加 了 用 户 对 数据 库 的 直接 访问 量 。 很 多 组 
织 将 他 们 访问 数据 库 的 电话 界面 改 为 Web 界面 ,并 提供 了 大 量 的 在 线 服务 和 信息 。 例 
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如 , 当 用 户 访问 一 家 在 线 书店 ,浏览 一 本 书 或 一 个 音乐 集 时 ,其 实 是 在 访问 存储 在 某 个 数 
据 库 中 的 数据 。 当 确认 了 一 个 网 上 订购 ,用 户 订单 也 就 保存 在 了 某 个 数据 库 中 。 当 用 户 
访问 一 个 银行 网 站 ,检索 账户 余额 和 交易 信息 时 ,这 些 信息 也 是 从 银行 的 数据 库 系统 中 取 
出 来 的 。 当 用 户 访问 一 个 网 站 时 ,关于 用 户 的 一 些 信息 可 能 会 从 某 个 数据 库 中 取出 ,并 且 
选择 出 那些 适合 显示 给 用 户 的 广告 。 此 外 ,关于 用 户 访问 网 络 的 数据 也 可 能 会 存储 在 一 
个 数据 库 中 。 

因此 ,尽管 用 户 界面 隐藏 了 访问 数据 库 的 细节 ,大 多 数 人 其 至 没有 意识 到 他 们 正在 和 
一 个 数据 库 打交道 ,然而 访问 数据 库 已 经 成 为 当今 几乎 每 个 人 生活 中 不 可 缺少 的 组 成 
部 分 。 


2. 常用 的 数据 库 管理 系统 


目前 有 许多 数据 库 管 理 系统 产品 ,如 Oracle、SQL Server、.DB2、MySQL、Access 等 ， 
各 以 自己 特有 的 功能 在 数据 库 市 场 上 占有 一 席 之 地 。 下 面 简要 介绍 几 种 常用 的 数据 库 管 
理 系 统 。 

1) Oracle 

Oracle 是 1983 年 推出 的 世界 上 第 一 个 开放 式 商品 化 关系 型 数据 库 管理 系统 ,也 是 应 
用 广泛 .功能 强大 的 数据 库 管 理 系统 。 它 采用 标准 的 结构 化 查询 语言 (SQL) ,支持 多 种 数 
据 类 型 ,提供 面向 对 象 存储 的 数据 支持 ,具有 第 4 代 语言 开发 工具 ,支持 UNIX、Windows 
NT、OS/2、Novell 等 多 种 平台 。Oracle 作为 一 个 通用 的 数据 库 管 理 系统 ,不 仅 具 有 完整 
的 数据 管理 功能 ,还 是 一 个 分 布 式 数据 库 系统 ,支持 各 种 分 布 式 功 能 ,特别 是 支持 
Internet 应 用 。 除 此 之 外 , 它 还 具有 很 好 的 并 行 处 理 功能 。Oracle 产品 主要 由 Oracle 服 
务 器 产品 ,Oracle 开发 工具 .Oracle 应 用 软件 组 成 ,也 有 基于 微机 的 数据 库 产品 。 作 为 一 
个 应 用 开发 环境 ,Oracle 提供 了 一 套 界 面 友好 、 功 能 齐全 的 数据 库 开发 工具 。Oracle 使 
用 PL/SQL 执行 各 种 操作 ,具有 可 开放 性 、 可 移植 性 .可 伸缩 性 等 功能 ,主要 满足 对 银行 、 
金融 .保险 等 企业 .事业 开发 大 型 数据 库 的 需求 。Oracle 先后 收购 了 PeopleSoft(103 亿 
美元 ) 和 BEA(80 多 亿美 元 ) ,通过 收购 ,实力 大 增 。2007 年 11 月 ,Oracle 11g 正式 发 布 ， 
功能 大 大 加 强 。Oracle 11g 是 Oracle 公司 发 布 的 一 个 比较 重要 的 数据 库 版 本 ,根据 用 户 
的 需求 实现 了 信息 生命 周期 管理 (Information Lifecycle Management) 等 多 项 创新 。 

2) SQL Server 

SQL 即 结 构 化 查询 语言 (Structured Query Language)。SQL Server 最 早出 现在 
1988 年 ,当时 只 能 在 OS/2 操作 系统 上 运行 。2000 年 12 月 ,微软 公司 发 布 了 SQL Server 
2000, 该 软件 可 以 运行 于 Windows NT/2000/XP 等 多 种 操作 系统 之 上 ,是 支持 客户 机 / 服 
务 器 结构 的 数据 库 管 理 系统 , 它 可 以 帮助 各 种 规模 的 企业 管理 数据 。2008 年 第 一 季度 发 
布 的 SQL Server 2008 不 仅 对 原 有 性 能 进行 了 改进 ,还 添加 了 许多 新 特性 ,比如 新 添 了 数 
据 集成 功能 ,改进 了 分 析 服 务 .报告 服务 ,以 及 Office 集成 等 。 

随 着 用 户 群 的 不 断 增 大 ,SQL Server 在 易 用 性 .可靠 性 .可 收缩 性 支持 数据 仓库 、 系 
统 集成 等 方面 日 趋 完 美 。 特 别 是 SQL Server 的 数据 库 搜索 引擎 ,可 以 在 绝 大 多 数 的 操作 
系统 上 运行 ,并 针对 海量 数据 的 查询 进行 了 优化 。 目 前 ,SQL Server 已 经 成 为 应 用 最 广 


89 


数据 结构 与 数据 库 应 用 教程 


泛 的 数据 库 产品 之 一 。 

3) DB2 

1973 年 ,IBM 研究 中 心 启动 System R 项 目 , 为 DB2 的 诞生 打下 了 良好 基础 。DB2 
是 IBM 公司 研制 的 一 种 关系 型 数据 库 系 统 , 主 要 应 用 于 大 型 应 用 系统 ,具有 较 好 的 可 伸 
缩 性 ,可 支持 从 大 型 计算 机 到 单 用 户 环境 ,应 用 于 OS/2、UNIX、Windows 等 平台 。 各 种 
平台 上 的 DB2 有 共同 的 应 用 程序 接口 ,运行 在 一 种 平台 上 的 程序 可 以 很 容易 地 移植 到 其 
他 平台 。DB2 是 基于 SQL 的 关系 型 数据 库 产 品 。20 世纪 80 年 代 初 期 ,DB2 的 重点 放 在 
大 型 的 主机 平台 上 。 到 了 20 世纪 90 年 代 初 ,DB2 发 展 到 中 型 计算 机 、 小 型 计算 机 以 及 微 
型 计算 机 平台 。DB2 适用 于 各 种 硬件 与 软件 平台 。2001 年 ,IBM 以 10 亿美 元 收购 了 
Informix 数据 库 业 务 。DB2 在 关系 型 数据 库 中 表现 非常 优秀 ,只 不 过 商业 化 较 重 ,所 以 
感觉 在 大 众 的 使 用 普遍 性 上 并 不 是 那么 强 , 然 而 在 行业 内 ,DB2 的 用 户主 要 分 布 在 金融 、 
商业 .铁路 .航空 .医院 .旅游 等 各 个 领域 ,以 金融 系统 的 应 用 最 为 突出 。 

4) Sybase 

Sybase 公司 的 第 一 个 关系 数据 库 产品 是 于 1987 年 5 月 推出 的 Sybase SQL Server 
1.0。Sybase 首先 提出 Client/Server 数据 库 体系 结构 的 思想 ,并 率先 在 Sybase SQL 
Server 中 实现 。1987 年 ,Sybase 觉得 单 靠 一 家 力量 难以 把 SQL Server 做 到 最 强 , 于 是 联 
合 微软 共同 开发 。1994 年 ,两 家 公司 合作 终止 。 截 至 此 时 ,两 家 公司 应 该 是 都 拥有 一 套 
完全 相同 的 SQL Server 代码 。Sybase SQL Server 后 来 为 了 与 微软 公司 的 Microsoft 
SQL Server 相 区 分 ,改名 叫 Sybase ASE(Adaptive Server Enterprise)。 现 在 的 Sybase， 
产品 策略 已 经 有 了 调整 ,在 移动 数据 库 市 场 上 , 它 的 ASA (Adaptive Server Anywhere) 
占据 了 绝对 的 地 位 ,拥有 约 70% 以 上 的 市 场 。 同 时 ,Sybase ASE 仍然 保持 着 大 型 数据 库 
厂商 的 地 位 。 在 电信 ,交通 ,市政 ,银行 等 领域 ,拥有 强大 的 市 场 。 它 的 产品 全 是 多 平台 
持 。Sybase ASE 又 分 出 了 Replication Server( 复 制服 务 器 )、Sybase IQ 等 重量 级 产品 ， 
相当 于 对 大 型 数据 库 市 场 又 进行 了 细 分 。 

5) MySQL 

MySQL 是 一 个 开放 源码 的 小 型 关联 式 数据 库 管 理 系统 ,开发 者 为 瑞典 MySQL AB 
公司 。 在 2008 年 1 月 16 日 被 Sun 公司 收购 。 而 2009 年 ,Sun 又 被 Oracle 收购 。 对 于 
MySQL 的 前 途 , 没 有 任何 人 抱 乐观 的 态度 。 目 前 ,MySQL 被 广泛 地 应 用 在 Internet 上 
的 中 小 型 网 站 中 。 由 于 其 体积 小 .速度 快 ,总 体 拥有 成 本 低 ,尤其 是 开放 源码 这 一 特点 , 许 
多 中 小 型 网 站 为 了 降低 网 站 总 体 拥 有 成 本 而 选择 了 MySQL 作为 网 站 数据 库 。 

MySQL 是 一 个 真正 的 多 用 户 ,多 线程 SQL 数据 库 服 务 器 , 它 是 一 个 客户 机 /服务 器 
结构 的 实现 。MySQL 是 现在 流行 的 关系 数据 库 中 的 一 种 , 相 比 其 他 的 数据 库 管理 系统 
来 说 , MySQL 具有 小 巧 .功能 齐全 查询 快捷 等 优点 。MySQL 的 主要 目标 是 快速 ,健壮 
和 易 用 。 关 键 是 它 是 免费 的 ,可 以 在 Internet 上 免费 下 载 ,并 可 免费 使 用 。MySQL 对 于 
一 般 中 小 型 ,甚至 大 型 应 用 都 能 够 胜任 。 

6) Access 

Access 是 在 Windows 操作 系统 下 工作 的 关系 型 数据 库 管 理 系 统 。 它 采用 了 
Windows 程序 设计 理念 ,以 Windows 特有 的 技术 设计 查询 .用 户 界面 .报表 等 数据 对 象 ， 
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内 内 了 VBA(CVisual Basic Application) ,具有 和 集成 的 开发 环境 。Access 提供 图 形 化 的 查 
询 工具 和 屏幕 .报表 生成 器 ,用 户 无 须 编程 和 了 解 SQL 即 可 建立 复杂 的 报表 、 界 面 , 它 会 
自动 生成 SQL 代码 。 

Access 被 集成 到 Office 中 ,具有 Office 系列 软件 的 一 般 特点 ,如 菜单 .工具 栏 等 。 与 
其 他 数据 库 管理 系统 软件 相 比 ,Access 更 加 简单 易学 ,一 个 普通 的 计算 机 用 户 , 即 使 没有 
程序 设计 语言 基础 ,仍然 可 以 快速 地 掌握 和 使 用 它 。 最 重要 的 一 点 是 ,Access 的 功能 比 
较 强 大 ,足以 应 付 一 般 的 数据 管理 及 处 理 需 要 ,适用 于 中 小 型 企业 数据 管理 的 需求 。 当 
然 , 在 数据 定义 数据 安全 可 靠 性 ,数据 有 效 性 控制 等 方面 , 它 比 前 面 几 种 数据 库 产品 还 是 
要 人 逊色 不 少 。 


9.2 数据 库 处 理 技术 的 发 展 过 程 


随 着 计算 机 硬件 和 软件 的 发 展 , 数 据 库 技术 从 20 世纪 60 年 代 末 发 展 至 今 ,已 经 有 几 
十 年 的 历史 了 。 在 这 几 十 年 的 历程 中 ,数据 库 技术 在 理论 研究 和 应 用 上 得 到 了 不 断 发 展 
和 完善 。 计 算 机 数据 管理 方法 至 今 大 致 经 历 了 4 个 阶段 : 人 工 管理 阶段 ,文件 系统 阶段 ， 
数据 库 系统 阶段 和 高 级 数据 库 阶 段 。 


9.2.1 人 工 管理 阶段 


在 人 工 管理 阶段 (20 世纪 50 年 代 中 期 以 前 ) ,计算 机 主要 用 于 科学 计算 ,其 他 工作 还 
没有 展开 。 外 部 存储 器 只 有 磁带 、 卡 片 和 纸 带 等 ,还 没有 磁盘 等 字 节 存 取 存储 设备 。 软 件 
只 有 汇编 语言 ,没有 操作 系统 和 管理 数据 的 软件 , 尚 无 数据 管理 方面 的 软件 。 数 据 处 理 方 
式 是 通过 批 处 理 来 执行 的 ,所 有 的 数据 完全 由 人 工 进行 管理 ,因此 这 个 阶段 被 称 为 人 工 管 
理 阶段 ,这 个 阶段 数据 管理 的 特点 如 下 。 

(1) 数据 不 保存 。 因 为 该 阶段 计算 机 主要 应 用 于 科学 计算 ,对 于 数据 保存 的 需求 尚 
不 迫切 ,只 是 在 计算 某 一 课题 时 将 数据 输入 ,完成 后 得 到 结果 ,因此 无 须 保存 数据 。 

(2) 系统 没有 专用 的 软件 对 数据 进行 管理 。 数 据 需 要 由 应 用 程序 自己 管理 ,没有 相 
应 的 软件 系统 负责 数据 的 管理 工作 。 因 此 ,每 个 应 用 程序 不 仅 要 规定 数据 的 逻辑 结构 ,而 
且 要 设计 物理 结构 ,包括 存储 结构 、 存 取 方法 .输入 方式 等 。 因 此 程序 员 负 担 很 重 。 

(3) 数据 不 共享 。 数 据 是 面向 程序 的 ,一 组 数据 只 能 
对 应 一 个 程序 。 多 个 应 用 程序 涉及 某 些 相同 的 数据 时 ， [四 程序 一 一 =[ 数 刀 组 1 
也 必须 各 自 定义 ,因此 程序 之 间 有 大 量 的 元 余数 据 。 a pr 

(4) 数据 不 具有 独立 性 。 程 序 依赖 于 数据 ,如 果 数据 区 - 


的 类 型 格式 或 输入 输出 方式 等 逻辑 结构 或 物理 结构 发 


生变 化 ,必须 对 应 用 程序 做 出 相应 的 修改 。 [ER 一 | 数据 组 ] 
在 人 工 管理 阶段 ,程序 与 数据 之 间 的 关系 可 用 图 9. 3 
表示 。 图 9.3 人 工 管理 阶段 程序 与 


数据 之 间 的 关系 
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9.2.2 文件 系统 阶段 


从 20 世纪 50 年 代 后 期 到 20 世纪 60 年 代 中 期 ,计算 机 不 仅 用 于 科学 计算 ,还 大 量 应 
用 于 信息 管理 。 大 量 的 数据 存储 ,检索 和 维护 成 为 紧迫 的 需求 。 在 硬件 方面 ,有 了 磁盘 、 
磁 鼓 等 直接 存储 设备 ;在 软件 方面 ,出 现 了 高 级 语言 和 操作 系统 , 且 操作 系统 中 有 了 专门 
管理 数据 的 软件 ,一 般 称 之 为 文件 系统 ,这 样 可 以 通过 数据 文件 的 存储 进行 数据 的 查询 、 
插入 ,修改 .删除 等 操作 ;在 处 理 方式 方面 ,不 仅 有 批 处 理 ,也 有 联机 实时 处 理 。 用 文件 系 
统管 理 数据 的 特点 如 下 。 

(1) 数据 以 文件 形式 可 长 期 保存 下 来 。 由 于 计算 机 大 量 用 于 数据 处 理 ,数据 需要 长 
期 保存 在 辅 存 上 ,以 便 用 户 可 随时 对 文件 进行 查询 .修改 和 增删 等 处 理 。 

(2) 文件 系统 可 对 数据 的 存 取 进行 管理 。 有 专门 的 软件 即 文 件 系统 进行 数据 管理 ， 
文件 系统 把 数据 组 织 成 相互 独立 的 数据 文件 ,利用 * 按 名 访问 , 按 记 录 存 取 ” 的 管理 技术 ， 
对 文件 进行 修改 .插入 和 删除 的 操作 。 因 此 ,程序 员 只 与 文件 名 打交道 ,不 必 明 确 数据 的 
物理 存储 ,大 大 减轻 了 程序 员 的 负担 。 

(3) 文件 组 织 多 样 化 。 此 时 已 出 现 顺序 文件 、 链 接 文件 .索引 文件 等 ,因而 对 文件 的 
记录 可 顺序 访问 ,也 可 随机 访问 ,更 便于 存储 和 查找 数据 。 但 文件 之 间 相互 独立 ,缺乏 联 
系 。 数据 之 间 的 联系 要 通过 程序 去 构造 。 

(4) 程序 与 数据 之 间 有 一 定 独立 性 。 由 专门 的 软件 即 文件 系统 进行 数据 管理 ,程序 
和 数据 之 间 由 软件 提供 的 存 取 方 法 进行 转换 ,数据 存储 发 生变 化 不 一 定 影响 程序 的 运行 ， 
既 可 大 大 节省 维护 的 工作 量 ,又 可 减轻 程序 员 的 负担 。 

在 文件 系统 阶段 ,程序 与 数据 之 间 的 关系 可 用 图 9.4 表示 。 

与 人 工 管理 阶段 相 比 ,文件 系统 阶段 对 数据 
应 用 程序 1 的 管理 有 了 很 大 的 进步 ,但 一 些 根本 性 问题 仍 没 
有 彻底 解决 ,主要 表现 在 以 下 三 个 方面 。 

- (1) 数据 宛 余 度 大 。 由 于 数据 的 基本 存 取 单 
位 是 记录 ,因此 ,程序 员 之 间 很 难 明白 他 人 数据 文 
件 中 数据 的 逻辑 结构 。 理 论 上 ,一 个 用 户 可 通过 
文件 管理 系统 访问 很 多 数据 文件 ,然而 实际 上 ,一 
个 数据 文件 只 能 对 应 于 同一 程序 员 的 一 个 或 几 个 

图 9.4 文件 系统 阶段 程序 与 程序 ,不 能 共享 , 即 文件 仍然 是 面向 应 用 的 。 当 不 
到 所 之 间 的 关系 同 的 应 用 程序 具有 部 分 相同 的 数据 时 ,也 必须 建 
立 各 自 的 文件 ,而 不 能 共享 相同 的 数据 ,因此 数据 的 元 余 度 大 ,浪费 存储 空间 。 

(2) 数据 独立 性 差 。 文 件 系统 中 的 文件 是 为 某 一 特定 应 用 服务 的 ,文件 的 逻辑 结构 
对 该 应 用 程序 来 说 是 优化 的 , 若 要 对 现 有 的 数据 增加 一 些 新 的 应 用 会 很 困难 ,系统 不 容易 
扩充 。 数 据 和 程序 相互 依赖 ,一 旦 改变 数据 的 逻辑 结构 ,必须 修改 相应 的 应 用 程序 。 而 应 
用 程序 如 果 发 生变 化 ,如 改 用 另 一 种 程序 设计 语言 来 编写 程序 ,也 需要 修改 数据 结构 。 因 
此 ,数据 和 程序 之 间 缺 乏 独立 性 。 
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(3) 数据 一 致 性 差 。 由 于 相同 数据 的 重复 存储 、 各 自 管理 ,在 进行 更 新 操作 时 ,容易 
造成 数据 的 不 一 致 性 。 如 某 学 校 利 用 计算 机 对 教 职 工 的 基本 情况 进行 管理 ,各 部 门 分 别 
建立 三 个 文件 : 职工 档案 文件 .职工 工资 文件 和 职工 保险 文件 。 每 一 职工 的 电话 号 码 在 
这 三 个 文件 中 重复 出 现 , 这 就 是 "数据 宛 余 ”。 若 某 职工 的 电话 号 码 需要 修改 ,就 要 修改 这 
三 个 文件 中 的 数据 ,否则 会 引起 同一 数据 在 三 个 文件 中 不 一 样 ;该 问题 产生 的 原因 主要 是 
三 个 文件 中 的 数据 没有 联系 。 若 在 职工 档案 文件 中 存放 电话 号 码 值 ,而 其 他 文件 中 不 存 
放电 话 号 码 值 ,而 存放 档案 文件 中 电话 号 码 值 的 位 置 作为 “指针 ”, 则 可 消除 文件 系统 的 三 
个 缺点 。 


9.2.3 数据 库 系统 阶段 


20 世纪 60 年 代 后 期 ,计算 机 硬件 .软件 有 了 进一步 的 发 展 。 计 算 机 应 用 于 管理 的 规 
模 更 加 庞大 ,数据 量 急 剧 增加 ;硬件 方面 出 现 了 大 容量 磁盘 ,使 计算 机 联机 存 取 大 量 数据 
成 为 可 能 ;硬件 价格 下 降 , 而 软件 价格 上 升 ,使 开发 和 维护 系统 软件 的 成 本 增加 。 文 件 系 
统 的 数据 管理 方法 已 无 法 适应 开发 应 用 系统 的 需要 。 为 解决 多 用 户 、 多 个 应 用 程序 共享 
数据 的 需求 ,出 现 了 统一 管理 数据 的 专门 软件 系统 , 即 数据 库 管 理 系 统 。 用 数据 库 系统 来 
管理 数据 比 文件 系统 具有 明显 的 优点 ,从 文件 系统 到 数据 库 系统 ,标志 着 数据 管理 技术 的 
飞跃 。 

数据 库 系统 管理 数据 的 特点 如 下 。 

(1) 数据 结构 化 。 

数据 结构 化 是 数据 库 与 文件 系统 的 根本 区 别 。 有 了 数据 库 管理 系统 后 ,数据 库 中 的 
任何 数据 都 不 属于 任何 应 用 。 数 据 是 公共 的 ,结构 是 全 面 的 。 它 是 在 对 整个 组 织 的 各 种 
应 用 (包括 将 来 可 能 的 应 用 ) 进 行 全 局 考虑 后 建立 起 来 的 总 的 数据 结构 。 它 是 按照 某 种 数 
据 模型 ,将 全 组 织 的 各 种 数据 组 织 到 一 个 结构 化 的 数据 库 中 ,整个 组 织 的 数据 不 是 一 盘 散 
沙 , 可 表示 出 数据 之 间 的 有 机 关联 。 

比如 要 建立 学 生成 绩 管理 系统 ,系统 包含 学 生 ( 学 号 ,姓名 ,性 别 , 系 别 ,年 龄 )、 课 程 
(课程 号 ,课程 名 ) ,成 绩 (学 号 ,课程 号 ,成 绩 ) 等 数据 ,分 别 对 应 三 个 文件 。 若 采用 文件 处 
理 方式 ,因为 文件 系统 只 表示 记录 内 部 的 联系 ,而 不 涉及 不 同文 件 记 录 之 间 的 联系 ,要 想 
查找 某 个 学 生 的 学 号 、 姓 名、 所 选课 程 的 名 称 和 成 绩 , 必 须 编写 一 段 不 算 简 单 的 程序 来 实 
现 。 而 采用 数据 库 方式 ,数据库 系统 不 仅 描述 数据 本 身 , 还 描述 数据 之 间 的 联系 ,上 述 查 
询 可 以 非常 容易 地 联机 查 到 。 

(2) 数据 共享 性 高 .元 余 少 , 易 扩 充 。 

数据 库 系统 从 全 局 角度 看 待 和 描述 数据 ,数据 不 再 面向 某 个 应 用 程序 而 是 面向 整个 
系统 ,因此 数据 可 以 被 多 个 用 户 .多 个 应 用 共享 使 用 。 这 样 便 减 少 了 不 必要 的 数据 元 余 ， 
节约 了 存储 空间 ,同时 也 避免 了 数据 之 间 的 不 相 容 性 与 不 一 致 性 。 所 谓 数据 的 不 一 致 性 
是 指 同 一 数据 不 同 副 本 的 值 不 一 样 。 采 用 人 工 管理 或 文件 系统 管理 时 ,由 于 数据 被 重复 
存储 , 当 不 同 的 应 用 使 用 和 修改 不 同 的 副本 时 就 很 容易 造成 数据 的 不 一 致 。 在 数据 库 中 
共享 数据 ,减少 了 由 于 数据 元 余 造成 的 不 一 致 现象 。 
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由 于 数据 面向 整个 系统 ,是 有 结构 的 数据 ,不 仅 可 被 多 个 应 用 共享 使 用 ,而 且 容 易 增 
加 新 的 应 用 ,这 就 使 得 数据 库 系 统 弹 性 大 ,易于 扩充 ,可 以 适应 各 种 用 户 的 要 求 。 可 以 取 
整体 数据 的 各 种 子 集 用 于 不 同 的 应 用 系统 , 当 应 用 需求 改变 或 增加 时 ,只 要 重新 选取 不 同 
的 子 集 或 加 上 一 部 分 数据 便 可 以 满足 新 的 需求 。 

(3) 数据 独立 性 高 。 

数据 独立 性 是 数据 库 领 域 中 的 一 个 常用 术语 ,包括 数据 的 逻辑 独立 性 和 数据 的 物理 
独立 性 。 

数据 的 逻辑 独立 性 是 指 用 户 的 应 用 程序 与 数据 库 的 逻辑 结构 是 相互 独立 的 , 即 当 数 
据 的 总 体 逻 辑 结 构 改 变 时 ,数据 的 局 部 逻辑 结构 不 变 , 由 于 应 用 程序 是 依据 数据 的 局 部 逻 
辑 结 构 编 写 的 ,所 以 应 用 程序 不 必修 改 , 从 而 保证 了 数据 与 程序 间 的 逻辑 独立 性 。 例 如 ， 
在 原 有 的 记录 类 型 之 间 增 加 新 的 联系 ,或 在 某 些 记 录 类 型 中 增加 新 的 数据 项 , 均 可 确保 数 
据 的 逻辑 独立 性 。 

数据 的 物理 独立 性 是 指 用 户 的 应 用 程序 与 存储 在 磁盘 上 的 数据 库 中 的 数据 是 相互 独 
立 的 , 即 当 数 据 的 存储 结构 改变 时 ,数据 的 逻辑 结构 不 变 , 从 而 应 用 程序 也 不 必 改 变 。 例 
如 ,改变 存储 设备 和 增加 新 的 存储 设备 ,或 改变 数据 的 存储 组 织 方式 , 均 可 确保 数据 的 物 
理 独 立 性 。 

(4) 有 统一 的 数据 控制 功能 。 

数据 库 为 多 个 用 户 和 应 用 程序 所 共享 ,对 数据 的 存 取 往往 是 并 发 的 , 即 多 个 用 户 可 以 
同时 存 取 数 据 库 中 的 数据 ,甚至 可 以 同时 存 取 数 据 库 中 的 同一 个 数据 。 为 确保 数据 库 数 
据 的 正确 有 效 和 数据 库 系 统 的 有 效 运 行 ,数据 库 管 理 系统 提供 下 述 4 方面 的 数据 控制 
功能 。 

Q@ 数据 的 安全 性 控制 。 

数据 的 安全 性 是 指 保护 数据 以 防止 不 合法 使 用 数据 造成 数据 的 泄漏 和 破坏 ,保证 数 
据 的 安全 和 机 密 , 使 每 个 用 户 只 能 按 规定 ,对 某 些 数据 以 某 些 方式 进行 使 用 和 处 理 。 例 
如 ,系统 提供 口令 检查 或 其 他 手段 来 验证 用 户 身份 ,防止 非法 用 户 使 用 系统 ;也 可 以 对 数 
据 的 存 取 权限 进行 限制 ,只 有 通过 检查 后 才能 执行 相应 的 操作 。 

@ 数据 的 完整 性 控制 。 

数据 的 完整 性 是 指 系统 通过 设置 一 些 完整 性 规则 以 确保 数据 的 正确 性 有效 性 和 相 
容 性 。 完 整 性 控制 将 数据 控制 在 有 效 的 范围 内 ,或 保证 数据 之 间 满 足 一 定 的 关系 ;有 效 性 
是 指数 据 是 否 在 其 定义 的 有 效 范围 ,如 月 份 只 能 用 1 一 12 的 正 整数 表示 ;正确 性 是 指数 据 
的 合法 性 ,如 年 龄 属于 数值 型 数据 ,只 能 含 0,1,…,9, 不 能 含 字 母 或 特殊 符号 ; 相 容 性 是 
指 表 示 同 一 事实 的 两 个 数据 应 相同 ,否则 就 不 相 容 ,如 一 个 人 不 能 有 两 个 性 别 。 

@ 并 发 控制 。 

多 用 户 同时 存 取 或 修改 数据 库 时 ,可 能 会 发 生 相互 干扰 而 提供 给 用 户 不 正确 的 数据 ， 
并 使 数据 库 的 完整 性 受到 破坏 ,因此 必须 对 多 用 户 的 并 发 操作 加 以 控制 和 协调 。 

@ 数据 恢复 。 

计算 机 系统 出 现 各 种 故障 是 很 正常 的 ,数据 库 中 的 数据 被 破坏 、 丢 失 也 是 可 能 的 。 当 
数据 库 被 破坏 或 数据 不 可 靠 时 ,系统 应 有 能 力 将 数据 库 从 错误 状态 恢复 到 最 近 某 一 时 刻 
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的 正确 状态 。 

数据 库 系统 阶段 ,程序 与 数据 之 间 的 关系 可 用 图 9. 5 表示 。 

从 文件 系统 管理 发 展 到 数据 库 系 统管 理 是 
信息 处 理 领 域 的 一 个 重大 变化 。 在 文件 系统 阶 
段 ,人 们 关注 的 是 系统 功能 的 设计 ,因此 程序 设 
计 处 于 主导 地 位 ,数据 服从 于 程序 设计 ;而 在 数 
据 库 系统 阶段 ,数据 的 结构 设计 成 为 信息 系统 首 
先 关心 的 问题 。 数 据 库 技术 从 20 世纪 60 年 代 
中 期 产生 到 今天 ,不 过 才 几 十 年 的 发 展 历史 , 它 
的 发 展 速度 之 快 、 使 用 范围 之 广 ,是 其 他 技术 所 
不 能 比拟 的 。 数 据 库 系统 已 经 从 20 世纪 70 年 
代 的 网 状 、 层 次 数据 库 系统 ,基本 实现 了 数据 管理 的 "集中 控制 与 数据 共享 ”这 一 目标 。20 
世纪 80 年 代 出 现 了 以 关系 型 数据 库 为 代表 的 第 二 代数 据 库 系统 ,如 Oracle、 Sybase、 
Informix ,Ingres 等 关系 数据 库 系统 已 广泛 用 于 大 型 信息 管理 系统 。 如 今 数据 库 技术 已 
经 比较 成 熟 , 随 着 计算 机 软 硬 件 的 发 展 ,数据 库 技术 仍 将 不 断 向 前 发 展 。 


图 9.5 数据 库 系 统 阶段 程序 与 
数据 之 间 的 关系 


9.2.4 ”高 级 数据 库 阶段 


20 世纪 70 年 代 , 层 次 、 网 状 、 关 系 型 三 大 数据 库 系 统 竟 定 了 数据 库 技术 的 概念 ,原理 
和 方法 的 基础 。 一 方面 ,20 世纪 80 年 代 以 来 ,数据 库 技术 在 商业 领域 的 巨大 成 功 刺激 了 
其 他 领域 对 数据 库 技术 需求 的 迅速 增长 ,这 些 新 的 领域 为 数据 库 应 用 开辟 了 新 的 天 地 。 
男 一 方面 ,在 应 用 中 提出 的 一 些 新 的 数据 管理 的 需求 也 直接 推动 了 数据 库 技 术 的 研究 和 
发 展 , 尤 其 是 面向 对 象 数据 库 系统 。 另 外 ,数据 库 技术 不 断 与 其 他 计算 机 分 支 结合 ,向 高 
一 级 的 数据 库 技术 发 展 。 例 如 ,数据库 技 术 与 分 布 处 理 技术 相 结合 ,出 现 了 分 布 式 数据 库 
系统 ;数据 库 技术 与 并 行 处 理 技术 相 结合 ,出 现 了 并 行 数据 库 系统 。 


1. 分 布 式 数据 库 技术 


随 着 地 理 上 分 散 的 用 户 对 数据 共享 的 要 求 日 益 增强 ,以 及 计算 机 网 络 技 术 的 发 展 ,在 
传统 的 集中 式 数据 库 系 统 基础 上 产生 和 发 展 了 分 布 式 数据 库 系统 。 

分 布 式 数据 库 系统 不 是 简单 地 把 集中 式 数 据 库 安 装 在 不 同 场地 ,用 网 络 连接 起 来 便 
实现 了 ,而 是 具有 自己 的 性 质 和 特征 。 

分 布 式 数 据 库 系 统 主 要 具有 以 下 特点 。 

(1) 数据 的 物理 分 布 性 和 逻辑 整体 性 。 数 据 库 中 的 数据 物理 上 分 布 在 各 个 场地 ,但 
逻辑 上 它们 是 一 个 相互 联系 的 整体 。 

(2) 场地 自治 和 协调 。 系 统 中 的 每 个 结 点 都 具有 独立 性 ,可 以 执行 局 部 应 用 请 求 ( 访 
问 本 地 DB) ;每 个 结 点 又 是 整个 系统 的 一 部 分 ,可 通过 网 络 处 理 全 局 的 应 用 请 求 , 即 可 以 
执行 全 局 应 用 (访问 异地 DB) 。 

(3) 各 地 的 计算 机 由 数据 通信 和 网 络 相 联 系 。 本 地 计算 机 单独 不 能 胜任 的 处 理 任务 ， 
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可 以 通过 通信 网 络 取 得 其 他 DB 和 计算 机 的 支持 。 

(4) 数据 的 分 布 透明 性 。 在 用 户 看 来 ,整个 数据 库 仍然 是 一 个 集中 的 数据 库 , 用 户 不 
必 关 心 数据 的 分 片 , 不 必 关 心 数据 物理 位 置 分 布 的 细节 ,不 必 关 心 数 据 副 本 的 一 致 性 ,分 
布 的 实现 完全 由 分 布 式 数据 库 管 理 系统 来 完成 。 

(5) 适合 分 布 处 理 , 提 高 了 系统 处 理 效率 和 可 靠 性 。 数 据 复 制 技术 是 分 布 式 数据 库 
的 重要 技术 。 然 而 ,分 布 式 数据 库 中 的 这 种 数据 宛 余 对 用 户 是 透明 的 , 即 用 户 不 必 知 道 宛 
余数 据 的 存在 ,维护 各 副本 的 一 致 性 也 由 系统 来 负责 。 

分 布 式 数 据 库 系统 兼顾 了 集中 管理 和 分 布 处 理 两 个 方面 ,因而 具有 良好 的 性 能 ,具体 
结构 如 图 9.6 所 示 。 


全 局 终端 图 通信 网 口 数据 库 


一 AAA 


局 部 处 理 机 


局 部 终端 局 部 终端 


局 部 处 理 机 


图 9.6 分 布 式 数据 库 


2. 面向 对 象 数据 库 技术 


在 数据 处 理 领 域 ,关系 数据 库 的 使 用 已 相当 普遍 ,然而 现实 世界 存在 着 许多 具有 更 复 
杂 数 据 结 构 的 实际 应 用 领域 ,而 层次 、 网 状 和 关系 等 三 种 模型 对 这 些 应 用 领域 显得 力 不 从 
心 。 例 如 多 媒体 数据 ,多维 表 格 数据 .CAD 数据 等 应 用 问题 ,都 需要 更 高 级 的 数据 库 技术 
来 表达 ,以 便于 管理 ,构造 与 维护 大 容量 的 持久 数据 ,并 使 它们 能 与 大 型 复杂 程序 紧密 结 
合 。 而 面向 对 象 数 据 库 正 是 适应 这 种 形势 发 展 起 来 的 , 它 是 面向 对 象 的 程序 设计 技术 与 
数据 库 技术 结合 的 产物 。 

面向 对 象 数据 库 系统 的 主要 特点 如 下 。 

(1) 对 象 数据 模型 能 完整 地 描述 现实 世界 的 数据 结构 ,能 表达 数据 间 嵌 套 、 递 归 的 
联系 。 

(2) 具有 面向 对 象 技术 的 封装 性 (把 数据 与 操作 定义 在 一 起 ) 和 继承 性 (继承 数据 结 
构 和 操作 ) 的 特点 ,提高 了 软件 的 可 重用 性 。 


3. 面向 应 用 领域 的 数据 库 技术 


数据 库 技术 是 计算 机 软件 领域 的 一 个 重要 分 支 ,经 过 30 多 年 的 发 展 ,已 形成 相当 规 
模 的 理论 体系 和 实用 技术 。 为 了 适应 数据 库 应 用 多 元 化 的 要 求 , 在 传统 数据 库 基 础 上 , 结 
合 各 个 应 用 领域 的 特点 ,人 们 开始 研究 适合 该 应 用 领域 的 数据 库 技术 ,如 数据 仓库 、 工 程 
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数据 库 ,统计 数据 库 、 科 学 数据 库 、 空 间 数 据 库 、 地 理 数据 库 等 。 


9.3 数据 模型 


数据 模型 (Data Model) 是 专门 用 来 抽象 .表示 和 处 理 现 实 世 界 中 的 数据 和 信息 的 
工具 。 

计算 机 系统 是 不 能 直接 处 理 现实 世界 的 ,现实 世界 只 有 在 数据 化 后 ,才能 由 计算 机 系 
统 来 处 理 这 些 代表 现实 世界 的 数据 。 为 了 把 现实 世界 的 具体 事物 及 事物 之 间 的 联系 转换 
成 计算 机 能 够 处 理 的 数据 ,必须 用 某 种 数据 模型 来 抽象 和 描述 这 些 数 据 。 数 据 模 型 是 数 
据 库 系统 的 核心 。 通 俗 地 讲 ,数据 模型 是 现实 世界 的 模拟 。 

数据 模型 应 满足 三 方面 要 求 : 一 是 能 比较 真实 地 模拟 现实 世界 ;二 是 容易 理解 ;三 是 
容易 在 计算 机 上 实现 。 在 数据 库 系统 中 针对 不 同 的 使 用 对 象 和 应 用 目的 ,采用 不 同 的 数 
据 模 型 。 

不 同 的 数据 模型 实际 上 提供 给 我 们 模型 化 数据 和 信息 的 不 同 工 具 。 根 据 模型 应 用 的 
不 同 , 可 将 模型 分 为 两 类 ,它们 分 别 属 于 两 个 不 同 的 层次 , 如 
图 9.7 所 示 。 现实 世界 

第 一 类 模型 是 概念 模型 ,也 称 信息 模型 , 它 是 一 种 独立 于 计 认识 抽象 
算 机 系统 的 数据 模型 ,完全 不 涉及 信息 在 计算 机 中 的 表示 ,只 是 
用 来 描述 某 个 特定 组 织 所 关心 的 信息 结构 。 概 念 模型 是 按 用 户 
的 观点 对 数据 和 信息 建 模 ,强调 其 语义 表达 能 力 ,概念 应 该 简单 、 
清晰 ,易于 用 户 理解 , 它 是 对 现实 世界 的 第 一 层 抽象 ,是 用 户 和 数 
据 库 设计 人 员 之 间 进 行 交流 的 工具 。 这 一 类 模型 中 最 著名 的 是 
“实体 -联系 模型”。 图 9.7 抽象 的 层次 

第 二 类 模型 是 数据 模型 ,主要 包括 网 状 模型 .层次 模型 .关系 
模型 等 , 它 是 按 计算 机 系统 的 观点 对 数据 建 模 ,是 直接 面向 数据 库 的 逻辑 结构 ,是 对 现实 
世界 的 第 二 层 抽象 。 这 类 模型 直接 与 DBMS 有 关 , 称 为 “逻辑 数据 模型 ”, 一 般 又 称 为 * 结 
构 数 据 模 型 "*。 这 类 模型 有 严格 的 形式 化 定义 ,以 便于 在 计算 机 系统 中 实现 。 它 通常 有 一 
组 严格 定义 的 无 二 义 性 语法 和 语义 的 数据 库 语言 ,人 们 可 以 用 这 种 语言 来 定义 ,操纵 数 据 
库 中 的 数据 。 

数据 模型 是 数据 库 系统 的 核心 和 基础 。 各 种 机 器 上 实现 的 DBMS 软件 都 是 基于 某 
种 数据 模型 的 。 


信息 世界 ”概念 模型 


机 器 世界 数据 模型 


9.3.1 概念 模型 


概念 层次 的 数据 模型 称 为 概念 数据 模型 ,简称 为 概念 模型 。 由 图 9.7 可 以 看 出 ,概念 
模型 实质 上 是 现实 世界 到 机 器 世界 的 一 个 中 间 层 次 。 它 按 用 户 的 观点 或 认识 对 现实 世界 
的 数据 和 信息 进行 建 模 ,主要 用 于 数据 库 设 计 。 
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1. 概念 模型 中 的 基本 概念 


概念 模型 涉及 的 概念 主要 有 以 下 几 个 。 

1) 实体 

实体 (Entity) 是 一 个 数据 对 象 , 指 应 用 中 可 以 区 别 的 客观 存在 的 事物 。 实 体 既 可 以 
是 实际 存在 的 对 象 ,也 可 以 是 某 种 概念 ,如 一 个 工人 ,一 个 学 生 . 一 个 学 校 ,一 个 操作 流程 
等 都 是 实体 。 

2) 属性 

实体 所 具有 的 某 一 特性 称 为 属性 (Attribute) 。 一 个 实体 可 以 由 若干 个 属性 来 描述 。 
如 职工 实体 由 职工 号 ` 姓 名、 性别、 年 龄 .职称 .部 门 等 属性 组 成 , 则 (1010, 陈 平 , 男 ,34, 工 
程 师 ,02) 这 组 属性 值 就 构成 了 一 个 具体 的 职工 实体 。 属 性 有 属性 名 和 属性 值 之 分 ,如 “ 姓 
名 ”是 属性 名 ,“ 陈 平 " 是 姓名 属性 的 一 个 属性 值 。 

3) 域 

属性 的 取 值 范围 称 为 该 属性 的 域 (Domain) ,如 “职工 性 别 ” 的 属性 域 为 ( 男 , 女 )。 

4) 实体 集 

所 有 属性 名 完全 相同 的 同类 实体 的 集合 , 称 为 实体 集 (Entity Set)。 如 全 体 职工 就 是 
一 个 实体 集 ,为 了 区 分 实体 集 , 每 个 实体 集 都 有 一 个 名 称 , 即 实体 名 。 职 工 实体 指 的 是 名 
为 “职工 ”的 实体 集 , 而 (1010, 陈 平 , 男 ,34 ,工程 师 ,02) 是 该 实体 集中 的 一 个 实体 ,同一 实 
体 集中 没有 完全 相同 的 两 个 实体 。 

5) 实体 型 

实体 集 的 名 及 其 所 有 属性 名 的 集合 , 称 为 实体 型 (Entity Type)。 例 如 ,职工 (职工 
号 ,姓名 ,性别 ,年龄 ,职称 ,部门 ) 就 是 职工 实体 集 的 实体 型 。 实 体型 抽象 地 刻画 了 所 有 同 
集 实体 ,在 不 引起 混淆 的 情况 下 ,实体 型 往往 简称 为 实体 。 

6) 码 

能 唯一 标识 实体 的 属性 或 属性 集 , 称 为 码 (Key) ,有 时 也 称 为 实体 标识 符 , 或 简称 为 
键 。 如 职工 实体 中 的 职工 号 属性 。 


2. 概念 模型 中 实体 的 联系 


在 现实 世界 中 ,事物 内 部 以 及 事物 之 间 是 有 联系 的 ,这 些 联 系 在 信息 世界 中 反映 为 实 
体 (型 ) 内 部 的 联系 和 实体 (型 ) 之 间 的 联系 。 实 体内 部 的 联系 通常 是 指 组 成 实体 的 各 属性 
之 间 的 联系 ,实体 之 间 的 联系 通常 是 指 不 同 实体 集 之 间 的 联系 。 

两 个 实体 集 之 间 的 联系 可 归纳 为 以 下 三 类 。 

1) 一 对 一 联系 (1 : 1) 

如 果 对 于 实体 集 El 中 的 每 个 实体 ,实体 集 E2 至 多 有 一 个 (也 可 没有 ) 实 体 与 之 联 
系 , 反 之 亦 然 , 那 么 实体 集 El 和 E2 的 联系 称 为 一 对 一 联系 , 记 为 1 : 1, 如 图 9. 8 所 示 。 

2) 一 对 多 联系 (1 : n) 

如 果实 体 集 El 中 每 个 实体 可 以 与 实体 集 E2 中 任意 个 ( 零 个 或 多 个 ) 实 体 间 有 联系 ， 
而 E2 中 每 个 实体 至 多 和 El 中 一 个 实体 有 联系 ,那么 称 El 对 E2 的 联系 是 一 对 多 联系 ， 
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实体 集 E1 实体 集 E2 


座位 LN 乘客 


图 9.8 两 个 实体 集 之 间 的 一 对 一 联系 (1 : 1) 


记 为 1 :n, 如 图 9.9 所 示 。 
实体 集 E1 实体 集 E2 


车 间 1 工人 


图 9.9 两 个 实体 集 之 间 的 一 对 多 联系 (1 : n) 


3) 多 对 多 联系 (m : n) 
如 果实 体 集 El 中 每 个 实体 可 以 与 实体 集 E2 中 任意 个 ( 零 个 或 多 个 ) 实 体 有 联系 , 反 
之 亦 然 ,那么 称 El 和 E2 的 联系 是 多 对 多 联系 , 记 为 m : n, 如 图 9.10 所 示 。 
实体 集 E1 。 ”实体 集 E2 


中 
El | 过 一 联系 名 二 | E2 
口 
口 IO 
Co 
口 D m n 
学 生 课程 


图 9.10 ”两 个 实体 集 之 间 的 多 对 多 联系 Gm : n) 


实际 上 ,一 对 一 联系 是 一 对 多 联系 的 特例 ,而 一 对 多 联系 又 是 多 对 多 联系 的 特例 。 
一 般 地 ,实体 之 间 的 一 对 一 、 一 对 多 、 多 对 多 联系 不 仅 存在 于 两 个 实体 型 之 间 ,也 存在 
于 两 个 以 上 的 实体 型 之 间 。 如 对 于 课程 .教师 与 参考 书 三 个 实体 型 , 若 一 门 课程 可 以 
有 多 个 教师 讲授 ,使 用 多 本 参考 书 , 而 每 一 个 教师 
只 讲授 一 门 课 程 ,每 一 本 参考 书 只 供 一 门 课 程 使 
用 , 则 课程 与 教师 ,参考 书 之 间 的 联系 是 一 对 多 的 ， 
如 图 9. 11 所 示 。 

两 个 实体 集 之 间 的 联系 究竟 属于 哪 一 类 ,不 仅 
与 实体 集 有 关 , 还 与 联系 的 内 容 有 关 。 如 主教 练 集 
与 队员 集 之 间 , 若 对 于 指导 关系 来 说 ,具有 一 对 多 的 


图 9.11 三 个 实体 型 之 间 的 联系 示例 


[一 一 一 一 一 一 一 
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联系 ;而 对 于 朋友 关系 来 说 ,就 应 是 多 对 多 的 联系 。 
与 现实 世界 不 同 , 信 息 世 界 中 实体 集 之 间 往 往 只 有 一 种 联 
系 。 此 时 ,在 谈论 两 个 实体 集 之 间 的 联系 性 质 时 ,就 可 略 去 联系 
名 ,直接 说 两 个 实体 集 之 间 具 有 一 对 一 、 一 对 多 或 多 对 多 的 联 
系 。 同 一 实体 集 内 的 各 实体 之 间 也 可 以 存在 一 对 一 、 一 对 多 、 多 
则 9 12 间 _ 宁 相生 有 对 多 的 联系 。 如 职工 实体 集 内 部 具有 领导 与 被 领导 的 联系 ,如 
对 多 联系 示例 图 9. 12 所 示 。 


3. 概念 模型 的 表示 方法 


概念 模型 是 对 信息 世界 建 模 , 因 此 概念 模型 应 能 方便 、 准 确 地 描述 信息 世界 中 的 常用 
概念 。 概 念 模 型 的 表示 方法 很 多 ,其 中 被 广泛 采用 的 是 实体 -联系 模型 (Entity- 
Relationship Model) , 它 是 由 Peter Chen 于 1976 年 在 题 为 “实体 -联系 模型 : 将 来 的 数据 
视图 ”的 论文 中 提出 的 ,简称 为 E-R 模型 。 

1) E-R 模型 的 元 素 

E-R 模型 的 主要 元 素 是 : 实体 集 , 属 性 ,联系 集 。 其 表示 方法 如 下 。 

(1) 实体 用 方 框 表 示 , 方 框 内 注 明 实体 的 名 称 。 实 体 名 常用 大 写字 母 开 头 的 有 具体 
意义 的 英文 名 词 表 示 。 然 而 ,为 了 便于 用 户 与 软件 开发 人 员 的 交流 ,在 需求 分 析 阶 段 建议 
用 中 文 表示 ,在 设计 阶段 再 根据 需要 转 成 英文 形式 。 下 文中 的 联系 名 和 属性 名 也 采用 这 
种 方式 。 

(2) 属性 用 椭圆 形 框 表示 , 框 内 写 上 属性 名 ,并 用 无 向 连 线 与 其 实体 集 相连 ,加 下 面 
线 的 属性 为 标识 符 。 

(3) 联系 用 菱形 框 表示 ,并 用 线段 将 其 与 相关 的 实体 连接 起 来 ,并 在 连 线 上 标明 联系 
的 类 型 , 即 1 : 1、1 : nm : n。 联 系 也 会 有 属性 ,用 于 描述 联系 的 特征 ,如 酬金 等 。 

因此 ,E-R 模型 也 称 为 E-R 图 。E-R 图 是 用 来 描述 实体 集 、 属 性 和 联系 的 图 形 。 图 
中 每 种 元 素 都 用 结 点 表示 。 用 实 线 来 连接 实体 集 与 它 的 属性 以 及 联系 与 它 的 实体 集 。 

2) 建立 ER 图 

建立 E-R 图 的 步骤 如 下 。 

(1) 确定 实体 和 实体 的 属性 ; 

(2) 确定 实体 和 实体 之 间 的 联系 及 联系 的 类 型 ; 

(3) 给 实体 和 联系 加 上 属性 。 

【 例 9.1】 一 个 简单 的 教学 数据 库 ,实体 间 存 在 的 联系 如 下 。 

(1) 一 个 学 生 只 能 属于 某 一 个 学 院 的 某 一 个 班级 ; 

(2) 一 个 学 院 有 多 个 班级 ,一 个 班级 只 能 属于 某 一 个 学 院 ; 

(3) 一 个 教师 只 能 属于 某 一 个 学 院 的 某 一 个 教研 室 ; 

(4) 一 个 学 院 有 多 个 教研 室 ,一 个 教研 室 只 能 属于 某 一 个 学 院 ; 

(5) 一 个 教师 可 以 讲授 多 门 课程 ,一 个 课程 可 以 有 多 个 教师 来 讲授 ; 

(6) 一 个 学 生 可 以 选修 多 门 课 程 ,一 门 课程 可 以 被 多 个 学 生 选 修 ; 

(7) 一 个 人 (学 生 和 教师 ) 只 能 有 一 个 身份 证 号 。 
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教学 E-R 图 的 表示 如 图 9. 13 所 示 。 


图 9.13 教学 数据 库 的 实体 -联系 图 


如 何 划分 实体 及 其 属性 有 两 个 原则 可 参考 : 一 是 属性 不 再 具有 需要 描述 的 性 质 , 属 
性 在 含义 上 是 不 可 分 的 数据 项 ;二 是 属性 不 能 再 与 其 他 实体 集 具 有 联系 , 即 E-R 模型 指 
定 联 系 只 能 是 实体 集 间 的 联系 。 

实体 集 可 用 多 种 方式 连接 起 来 ,然而 把 每 种 可 能 的 联系 都 加 到 设计 中 却 不 是 一 个 好 
办 法 。 首 先 , 它 会 导致 元 余 , 即 一 个 联系 连接 起 来 的 两 个 实体 或 实体 集 可 以 从 一 个 或 多 个 
其 他 联系 中 导出 。 其 次 ,使 得 数据 库 可 能 需要 更 多 的 空间 来 存储 宛 余 元 素 ,而 且 修 改 数据 
库 会 更 复杂 ,因为 数据 的 一 处 变动 会 引起 存储 联系 的 多 处 变动 。 

如 何 划分 实体 和 联系 也 有 一 个 原则 可 参考 : 当 描述 发 生 在 实体 集 之 间 的 行为 时 ,最 
好 用 联系 集 。 如 读者 和 图 书 之 间 的 借 、 还 书 行为 ,顾客 和 商品 之 间 的 购买 行为 , 均 应 作为 

划分 联系 的 属性 的 原则 : 一 是 发 生 联 系 的 实体 的 标识 属性 应 作为 联系 的 默认 属性 ; 
二 是 和 联系 中 的 所 有 实体 都 有 关 的 属性 ,如 学 生 和 课程 的 选课 联系 中 的 成 绩 属性 。 


9.3.2 数据 模型 


1. 数据 模型 的 组 成 要 素 


数据 模型 是 数据 库 系统 的 核心 和 基础 ,任何 DBMS 都 支持 一 种 数据 模型 。 数 据 模型 
是 严格 定义 的 一 组 概念 的 集合 , 它 描 述 了 系统 的 静态 特性 、 动 态 特性 和 完整 性 约束 条 件 。 
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因此 ,数据 模型 通常 由 数据 结构 .数据 操作 和 完整 性 约束 三 部 分 组 成 。 

1) 数据 结构 

任何 一 种 数据 模型 都 规定 了 一 种 数据 结构 , 即 信息 世界 中 的 实体 和 实体 之 间 联 系 的 
表示 方法 。 数 据 结构 描述 了 系统 的 静态 特性 ,是 数据 模型 本 质 的 内 容 。 

数据 结构 是 所 研究 的 对 象 类 型 的 集合 。 这 些 对 象 是 数据 库 的 组 成 成 分 , 它 包 括 两 类 ， 
一 类 是 与 数据 类 型 内容 ,性质 有 关 的 对 象 , 如 网 状 模 型 中 的 数据 项 .记录 ,关系 模型 中 的 
域 `. 属 性 .关系 等 ; 另 一 类 是 与 数据 之 间 联 系 有 关 的 对 象 , 如 网 状 模型 中 的 系 型 (Set 
Type) 。 

数据 结构 是 刻画 一 个 数据 模型 性 质 最 重要 的 方面 ,因此 在 数据 库 系 统 中 ,通常 按照 其 
数据 结构 的 类 型 来 命名 数据 模型 ,如 层次 结构 .网 状 结构 和 关系 结构 的 数据 模型 分 别 命名 
为 层次 模型 .网 状 模 型 和 关系 模型 。 

2) 数据 操作 

数据 操作 是 对 数据 库 中 各 种 对 象 (型 ) 的 实例 ( 值 ) 允 许 执行 的 操作 的 集合 ,包括 操 
作 及 有 关 的 操作 规则 。 数 据 操 作 描述 了 系统 的 动态 特性 。 对 数据 库 的 操作 主要 有 数 
据 维护 和 数据 检索 两 大 类 ,这 是 任何 数据 模型 都 必须 规定 的 操作 ,包括 操作 符 、 含 义 、 
规则 等 。 

3) 完整 性 约束 

完整 性 约束 是 一 组 完整 性 规则 的 集合 。 完 整 性 规则 是 给 定 的 数据 模型 中 数据 及 其 联 
系 所 具有 的 制约 和 依存 规则 ,用 以 限定 符合 数据 模型 的 数据 库 状态 以 及 状态 的 变化 ,以 保 
证 数据 的 正确 、 相 容 和 有 效 。 


2. 最 常用 的 数据 模型 


目前 ,数据 库 领 域 中 最 常用 的 数据 模型 有 以 下 4 种 。 

(1) 层次 模型 (Hierarchical Model) ; 

(2) 网 状 模型 (Network Model) ; 

(3) 关系 模型 (Relational Model) ; 

(4) 面向 对 象 模型 (Object Oriented Model) 。 

其 中 ,前 两 类 模型 称 为 非 关系 模型 。 非 关系 模型 的 数据 库 系统 在 20 世纪 70 年 代 至 
20 世纪 80 年 代 初 非常 流行 ,在 数据 库 系 统 产品 中 占据 了 主导 地 位 ,在 数据 库 系统 的 初期 
起 了 重要 的 作用 。 在 关系 模型 得 到 发 展 后 , 非 关系 模型 迅速 衰退 。 在 我 国 , 早 已 不 见 非 关 
系 模 型 ;但 在 美国 等 一 些 国家 里 ,由 于 早期 开发 的 应 用 系统 是 基于 层次 数据 库 或 网 状 数据 
库 系 统 的 ,因此 目前 仍 有 层次 数据 库 和 网 状 数据 库 系 统 在 继续 使 用 。 关 系 模型 是 目前 使 
用 最 广泛 的 数据 模型 ,占据 数据 库 的 主导 地 位 。 面 向 对 象 数 据 库 是 近 些 年 才 出 现 的 数据 
模型 ,是 目前 数据 库 技术 的 研究 方向 。 

数据 模型 是 对 客观 事物 及 其 联系 的 数据 化 描述 。 在 数据 库 系统 中 ,对 现实 世界 中 数 
据 的 抽象 .描述 以 及 处 理 等 都 是 通过 数据 模型 来 实现 的 。 数 据 模型 是 数据 库 系 统 设计 中 
用 于 提供 信息 表示 和 操作 手段 的 形式 构架 ,是 数据 库 系统 实现 的 基础 。 目 前 ,在 实际 数据 
库 系 统 中 支持 的 数据 模型 主要 有 三 种 : 层次 模型 ,网 状 模型 和 关系 模型 。 面 向 对 象 数据 
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模型 将 是 下 一 代数 据 库 模 型 的 热点 之 一 。 
9.3.3 层次 模型 


层次 模型 是 数据 库 系 统 中 最 早出 现 的 数据 模型 ,典型 的 层次 模型 系统 是 美国 IBM 公 
司 于 1968 年 推出 的 IMS(Information Management System ,信息 管理 系统 ) ,这 个 系统 在 
20 世纪 70 年 代 在 商业 上 得 到 广泛 应 用 。 

层次 模型 用 树 状 结构 来 表示 各 类 实体 以 及 实体 间 的 联系 。 在 
现实 世界 中 ,有 许多 事物 是 按 层次 组 织 起 来 的 ,如 一 个 系 有 若干 个 
专业 和 教研 室 ,一 个 专业 有 若干 个 班级 ,一 个 班级 有 若干 个 学 生 ,一 
个 教研 室 有 若干 个 教师 。 其 数据 库 模型 如 图 9. 14 所 示 。 层 次 模型 
用 一 棵 “有 向 树 ” 的 数据 结构 来 表示 各 类 实体 以 及 实体 间 的 联系 。 
在 树 中 ,每 个 结 点 表示 一 个 记录 类 型 , 结 点 间 的 连 线 (或 边 ) 表 示 记 
录 类 型 间 的 关系 ,每 个 记录 类 型 可 包含 若干 个 字段 ,记录 类 型 描述 
的 是 实体 ,字段 描述 实体 的 属性 ,各 个 记录 类 型 及 其 字段 都 必须 
命名 。 


1. 层次 模型 的 数据 结构 


树 的 结 点 是 记录 类 型 ,有 且 仅 有 一 个 结 点 无 父 结 点 ,这 样 的 结 点 称 为 根 结 点 ,每 个 非 
根 结 点 有 且 只 有 一 个 父 结 点 。 在 层次 模型 中 ,一 个 结 点 可 以 有 几 个子 结 点 ,也 可 以 没有 子 
结 点 。 在 前 一 种 情况 下 ,这 几 个 子 结 点 称 为 兄弟 结 点 ,在 后 一 种 情况 下 ,该 结 点 称 为 叶 结 
点 。 图 9. 15 是 图 9. 14 数据 模型 的 一 个 实例 。 它 是 计算 机 系 记 录 值 及 其 所 有 的 后 代 记 录 


值 组 成 的 一 棵 树 。 
软件 工程 专业 软件 教研 室 


图 9.14 层次 模型 


计算 机 应 用 技术 专业 硬件 教研 室 
) | 
1 | 
计 软 0301 计 应 0301 计 网 0301 张涛 张 海 陈 海 涛 
本 到 | 于 | 陈 俊 刘 平 张 文 


张海涛 涛 | 万 海 涛 | 
陈 之 | 一 | 陈 文 ] 陈 平 | 


图 9.15 学 校 层次 数据 库 模型 


层次 模型 的 基本 数据 结构 是 层次 结构 ,也 称 树 状 结构 , 它 的 数据 结构 特点 如 下 。 
(1) 有 且 仅 有 一 个 结 点 没有 双亲 ,该 结 点 称 为 根 结 点 。 
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(2) 除根 结 点 以 外 的 其 他 结 点 有 且 仅 有 一 个 双亲 结 点 ,这 就 使 得 层次 数据 库 系统 只 
能 直接 处 理 一 对 多 的 实体 关系 。 

(3) 任何 一 个 给 定 的 记录 值 只 有 按 其 路 径 查 看 时 ,才能 显 出 它 的 全 部 意义 ,没有 一 个 
子女 记录 值 能 够 脱离 双亲 记录 值 而 独立 存在 。 


2. 层次 模型 的 数据 操作 与 数据 完整 性 约束 


层次 模型 的 数据 操作 的 最 大 特点 是 必须 从 根 结 点 入 手 , 按 层次 顺序 访问 。 层 次 模型 
的 数据 操作 主要 有 查询 插入、 删除 和 修改 ,进行 插入 、\ 删 除 和 修改 操作 时 要 满足 层次 模型 
的 完整 性 约束 条 件 。 

在 进行 插入 操作 时 ,如 果 没 有 相应 的 双亲 结 点 值 就 不 能 插入 子女 结 点 值 。 如 在 如 
图 9. 15 所 示 的 层次 数据 库 中 , 若 新 调和 人 一 名 教师 ,但 尚未 分 配 到 某 个 教研 室 , 这 时 就 不 能 
将 新 教员 插入 到 数据 库 中 。 

在 进行 删除 操作 时 ,如果 删 除 双亲 结 点 值 , 则 相应 的 子女 结 点 值 也 将 被 同时 删除 。 如 
在 如 图 9. 15 所 示 的 层次 数据 库 中 , 若 删除 软件 教研 室 , 则 该 教研 室 所 有 教师 的 数据 将 全 

在 进行 修改 操作 时 ,应 修改 所 有 相应 的 记录 ,以 保证 数据 的 一 致 性 。 


3. 层次 模型 的 优 缺 点 


层次 模型 的 优点 主要 有 以 下 几 个 。 

(1) 层次 数据 模型 本 身 比 较 简单 ,只 需 很 少 的 几 条 命令 就 能 操纵 数据 库 , 比 较 容易 
使 用 。 

(2) 结构 清晰 , 结 点 间 联 系 简单 ,只 要 知道 每 个 结 点 的 双亲 结 点 ,就 可 以 知道 整个 模 
型 结构 。 现 实 世界 中 许多 实体 间 的 联系 本 来 就 呈现 出 一 种 很 自然 的 层次 关系 。 

(3) 它 提供 了 良好 的 数据 完整 性 支持 。 

(4) 对 于 实体 间 联 系 是 固定 的 , 且 预 先 定义 好 的 应 用 系统 ,采用 层次 模型 实现 ,其 性 
能 优 于 关系 模型 ,不 低 于 网 状 模型 。 

层次 模型 的 缺点 主要 有 以 下 几 个 。 

(1) 层次 模型 不 能 直接 表示 两 个 以 上 的 实体 型 间 的 复杂 的 联系 和 实体 型 间 的 多 对 多 
联系 ,只 能 通过 引入 宛 余 数据 或 创建 虚拟 结 点 的 方法 来 解决 , 易 产 生 不 一 致 性 。 

(2) 对 数据 的 插入 和 删除 的 操作 限制 太 多 。 

(3) 查询 子女 结 点 必须 通过 双亲 结 点 。 

(4) 由 于 结构 严密 ,层次 命令 趋 于 程序 化 。 


9.3.4 网 状 模型 


现实 世界 中 事物 之 间 的 联系 更 多 地 是 非 层 次 关系 的 ,用 层次 模型 表示 这 种 关系 很 不 
直观 ,网 状 模型 克服 了 这 一 浆 病 ,可 以 清晰 地 表示 这 种 非 层次 关系 。 
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网 状 模型 取消 了 层次 模型 的 限制 ,在 层次 模型 中 , 若 一 个 结 点 可 以 有 一 个 以 上 的 父 结 
点 ,就 得 到 网 状 模型 。 用 有 向 图 结构 表示 实体 类 型 及 实体 间 联 系 的 数据 模型 称 为 网 状 模 
型 (Network Model) 。1969 年 ,由 CODASYL 组 织 提出 的 DBTG 报告 中 的 数据 模型 是 网 
状 模 型 的 主要 代表 。 


1. 网 状 模型 的 数据 结构 


网 状 模型 的 特点 如 下 。 

(1) 有 一 个 以 上 的 结 点 没有 双亲 ; 

(2) 至 少 有 一 个 结 点 可 以 有 多 于 一 个 双亲 。 

允许 两 个 或 两 个 以 上 的 结 点 没有 双亲 结 点 ,允许 某 个 结 点 有 多 个 双亲 结 点 , 则 此 时 有 
向 树 变 成 了 有 向 图 ,该 有 向 图 描述 了 网 状 模型 。 

与 层次 模型 不 同 ,网 状 模型 中 的 任意 结 点 间 都 可 以 有 联系 ,而 且 可 以 表示 多 对 多 的 联 
系 ,网 状 模 型 是 一 种 比 层次 模型 更 具 普 遍 性 的 结构 , 它 去 掉 了 层次 模型 的 两 个 限制 ,允许 
多 个 结 点 没有 双亲 结 点 ,允许 结 点 有 多 个 双亲 结 点 。 此 外 , 它 还 允许 两 个 结 点 之 间 有 多 种 
联系 ( 称 为 复合 联系 )。 因 此 ,网 状 模型 可 以 更 直接 地 去 描述 现实 世界 。 而 层次 模型 实际 
上 是 网 状 模 型 的 一 个 特例 。 

网 状 模 型 中 每 个 结 点 表示 一 个 记录 型 (实体 ) ,每 个 记录 型 可 包含 若干 个 字段 (实体 的 
属性 ) , 结 点 间 的 连 线 表 示 记 录 类 型 (实体 ) 间 的 父子 拥有 


关系 ,箭头 表示 从 箭 尾 的 记录 类 型 到 箭头 的 记录 类 村 
型 间 的 联系 是 1 :联系 ,例如 ,学 生 和 教师 间 的 关 分 配 
系 ,一 个 学 生 可 以 有 多 个 教师 任教 ,一 个 教师 可 以 教 

多 个 学 生 。 学 校 网 状 模型 如 图 9. 16 所 示 教师 


2. 网 状 模型 的 数据 操纵 与 完整 性 约束 0 


网 状 模型 一 般 没 有 层次 模型 那样 严格 的 完整 性 约束 条 件 , 但 具体 的 网 状 数据 库 系 统 
(如 DBTG) 对 数据 操纵 都 加 了 一 些 限制 ,提供 了 一 定 的 完整 性 约束 。 

网 状 模型 的 数据 操纵 主要 包括 查询 .插入 、 删 除 和 修改 数据 。 

插入 数据 时 ,允许 插入 尚未 确定 双亲 结 点 值 的 子女 结 点 值 ,如 可 增加 一 名 尚未 分 配 到 
某 个 教研 室 的 新 教师 ,也 可 增加 一 些 刚 来 报到 还 未 分 配 和 宿舍 的 学 生 。 

删除 数据 时 ,允许 只 删除 双亲 结 点 值 ,如 可 删除 一 个 教研 室 , 而 该 教研 室 中 所 有 教师 
的 信息 仍 保留 在 数据 库 中 。 

修改 数据 时 ,可 直接 表示 非 树 状 结构 ,而 无 须 像 层次 模型 那样 增加 元 余 结 点 ,因此 , 修 
改 操作 时 只 需 更 新 指定 记录 即 可 。 

它 没有 像 层 次 数据 库 那样 有 严格 的 完整 性 约束 条 件 , 只 提供 一 定 的 完整 性 约束 ,主要 
有 以 下 几 种 。 

(1) 支持 记录 码 的 概念 , 码 是 唯一 标识 记录 的 数据 项 的 集合 。 如 学 生 记录 中 学 号 是 
码 , 因 此 数据 库 中 不 允许 学 生 记录 中 学 号 出 现 重复 值 。 
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(2) 保证 一 个 联系 中 双亲 记录 和 子女 记录 之 间 是 一 对 多 的 联系 。 
(3) 可 以 支持 双亲 记录 和 子女 记录 之 间 的 某 些 约束 条 件 。 如 有 些 子女 记录 要 求 双亲 
记录 存在 才能 插入 ,双亲 记录 删除 时 也 连同 删除 。 


3. 网 状 模型 的 优 缺 点 


网 状 模型 的 优点 如 下 。 

(1) 能 更 为 直接 地 描述 客观 世界 ,表示 实体 间 的 多 种 复杂 联系 ,一 个 结 点 可 以 有 多 个 
双亲 。 

(2) 具有 良好 的 性 能 ,存储 效率 较 高 。 

网 状 模型 的 缺点 如 下 。 

(1) 结构 复杂 ,而 且 随 着 应 用 环境 的 扩大 ,数据 库 的 结构 变 得 越 来 越 复杂 ,不 利于 最 
终 用 户 掌握 。 

(2) 其 DDL、DML 极其 复杂 ,用 户 不 容易 使 用 。 

(3) 数据 独立 性 差 , 由 于 实体 间 的 联系 本 质 上 是 通过 存 取 路 径 表示 的 ,因此 应 用 程序 
在 访问 数据 时 要 指定 存 取 路 径 。 


9.3.5 关系 模型 


关系 模型 是 目前 最 常用 的 一 种 数据 模型 。 关 系数 据 库 系统 采用 关系 模型 作为 数据 的 
组 织 方式 ,目前 市 场 上 推出 的 数据 库 系统 几乎 都 支持 关系 模型 。 

1970 年 ,美国 IBM 公司 的 研究 员 E. F. Codd 首次 提出 了 数据 系统 的 关系 数据 模 
型 ,标志 着 数据 库 系 统 新 时 代 的 来 临 ,开创 了 数据 库 关系 方法 和 关系 数据 理论 的 研究 ， 
为 数据 库 技术 商定 了 理论 基础 。 由 于 E. F. Codd 的 杰出 工作 ,他 于 1981 年 荣获 ACM 
图 灵 奖 。 

1980 年 后 ,各 种 关系 数据 库 管理 系统 的 产品 迅速 出 现 , 如 Oracle、 Ingress、Sybase、 
Informix 等 ,关系 数据 库 系统 统治 了 数据 库 市 场 , 数 据 库 的 应 用 领域 迅速 扩大 。 

与 层次 模型 和 网 状 模型 相 比 ,关系 模型 的 概念 简单 清晰, 并且 具 有 严格 的 数据 基础 ， 
形成 了 关系 数据 理论 ,操作 也 直观 、 容 易 , 因 此 易学 易 用 。 无 论 是 数据 库 的 设计 和 建立 ,还 
是 数据 库 的 使 用 和 维护 ,都 比 非 关 系 模型 时 代 简 便 得 多 ,因而 迅速 得 到 了 广泛 的 应 用 ,并 
在 数据 库 系统 中 占据 了 统治 地 位 。 

与 其 他 的 数据 模型 相同 ,关系 模型 也 是 由 数据 结构 .数据 操作 和 完整 性 约束 三 部 分 
组 成 。 

1. 数据 结构 


在 关系 模型 中 ,数据 的 逻辑 结构 是 关系 。 关 系 可 形象 地 用 二 维 表 表 示 , 它 由 行 和 列 组 
成 。 现 以 学 生 表 、 课 程 表 和 成 绩 表 为 例 , 介 绍 关系 模型 中 的 一 些 术语 ,如 图 9. 17 所 示 。 
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学 号 姓名 性 别 出 生日 期 所 学 专业 
201712001 周 博 杰 男 1999-4-19 计算 机 
201712002 寇 志 敏 女 1998-12-24 计算 机 
201823001 李 婷 婷 女 2000-4-5 信息 系统 
201823002 梁 启 永 男 2000-6-28 信息 系统 
201825013 周 星 伊 男 1999-2-27 市 场 营销 
201825015 魏 子 窗 女 2000-3-20 市 场 营销 
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课程 号 课程 名 称 学 时 学 分 
CS002 数据 库 系 统 概论 80 5 
CS005 操作 系统 64 4 
MG141 基础 会 计 48 

Score 表 
学 号 课程 号 学 期 成 绩 
201712001 CS002 181 92 
201712001 CS005 182 88 
201712002 CS002 181 86 
201712002 CS005 182 93 
201712002 MG141 191 78 
201823001 CS002 191 85 
201823001 CS005 192 95 
201823002 CS002 191 72 
201823002 CS005 192 88 
201825013 MG141 182 84 
201825015 MG141 182 92 


图 9. 17 关系 模型 的 数据 结构 
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(1) 关系 (Relation): 一 个 关系 可 用 一 个 表 来 表示 , 常 称 为 表 , 如 图 9. 17 中 的 
Student 表 、Course 表 和 Score 表 。 每 个 关系 ( 表 ) 都 有 与 其 他 关系 ( 表 ) 不 同 的 名 称 。 

(2) 元 组 (Tuple) : 表 中 的 一 行 数据 总 称 为 一 个 元 组 。 一 个 元 组 即 为 一 个 实体 的 所 
有 属性 值 的 总 称 。 一 个 关系 中 不 能 有 两 个 完全 相同 的 元 组 。 

(3) 属性 (Attribute) : 表 中 的 每 一 列 即 为 一 个 属性 。 每 个 属性 都 有 一 个 属性 名 ,在 
每 一 列 的 首 行 显示 。 一 个 关系 中 不 能 有 两 个 同名 属性 。 

(4) 域 (Domain): 一 个 属性 的 取 值 范围 就 是 该 属性 的 域 。 如 Score 表 的 成 绩 属 性 域 
为 整数 (0 一 100) ,Student 表 的 性 别 域 为 ( 男 , 女 ) 等 。 

(5) 分 量 (Component) : 一 个 元 组 在 一 个 属性 上 的 值 称 为 该 元 组 在 此 属性 上 的 分 量 。 

(6) 码 (Key): 表 中 的 某 个 属性 或 属性 组 ,可 以 唯一 确定 一 个 元 组 ,如 图 9. 17 中 的 学 
号 ,可 以 唯一 确定 一 个 学 生 ,也 就 成 为 Student 关系 的 码 。 

(7) 外 码 (Foreign Key): 表 中 的 某 个 属性 或 属性 组 ,用 来 描述 本 关系 中 的 元 组 (实体 ) 
与 另 一 个 关系 中 的 元 组 (实体 ) 之 间 的 联系 ,因此 ,外 码 的 取 值 范围 对 应 于 另 一 个 关系 的 码 的 
取 值 范围 的 子 集 。 如 图 9. 17 所 示 的 关系 Score 中 的 学 号 , 它 描述 了 关系 Score 与 关系 
Student 的 联系 ( 即 哪个 学 生 选 修了 课程 ) ,因此 学 号 是 关系 Score 的 外 码 ; 同 理 , 课 程 号 也 是 
关系 Score 的 外 码 , 它 描述 了 关系 Score 与 关系 Course 的 联系 ( 即 哪 门 课程 被 学 生 选 修了 )。 

(8) 关系 模式 (Relation Schema) : 一 个 关系 的 关系 名 及 其 全 部 属性 名 的 集合 简称 为 
该 关系 的 关系 模式 。 一 般 表 示 为 ， 

关系 名 (属性 1, 属 性 2,… ,属性 n) 

例如 ,图 9.17 中 的 三 个 关系 Student、Course 和 Score 可 分 别 描述 为 : 

Student (学 号 ,姓名 ,性 别 , 出 生日 期 ,所 学 专业 ) 

Course (课程 号 ,课程 名 称 , 学 时 ,学 分 ) 

Score (学 号 ,课程 号 ,学 期 ,成 绩 ) 

常用 下 画 线 标注 属性 为 主 码 属性 ,使 用 波浪 线 标注 属性 为 外 码 属性 。 

关系 模式 是 型 ,描述 了 一 个 关系 的 结构 ;关系 则 是 值 , 是 元 组 的 集合 ,是 某 一 时 刻 关系 
模式 的 状态 或 内 容 。 因 此 ,关系 模式 是 稳定 的 ,静态 的 ,而 关系 则 是 随时 间 变 化 的 ,动态 
的 。 但 在 不 引起 混淆 的 场合 中 ,两 者 都 称 为 关系 。 

关系 是 关系 模型 中 最 基本 的 数据 结构 。 关 系 既 用 来 表示 实体 ,如 图 9. 17 中 的 
Student 表 , 也 用 来 表示 实体 间 的 关系 ,如 学 生 与 课程 之 间 的 联系 可 以 描述 为 Score 表 。 

关系 模型 要 求 关 系 必须 是 规范 化 的 , 即 要 求 关 系 必须 满足 一 定 的 规范 条 件 ,这 些 规范 
条 件 如 下 。 

(1) 关系 中 的 每 一 列 都 必须 是 不 可 分 的 基本 数据 项 , 即 不 允许 表 中 还 有 表 。 

(2) 在 一 个 关系 中 ,属性 间 的 顺序 元 组 间 的 顺序 是 无 关 紧 要 的 。 


2. 数据 操作 


关系 数据 模型 的 操作 主要 包括 查询 ,插入 、 删 除 和 修改 数据 。 它 的 特点 在 于 : 
(1) 操作 对 象 和 操作 结果 都 是 关系 , 即 关 系 模型 中 的 操作 是 集合 操作 。 它 是 若干 元 
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组 的 集合 ,而 不 像 非 关系 模型 中 那样 是 单 记录 的 操作 方式 。 
(2) 关系 模型 中 , 存 取 路 径 对 用 户 是 隐藏 的 。 用 户 只 要 指出 “干什么 ”或 “ 找 什 么 ”, 不 
必 详 细 说 明 “ 怎 么 干 ”或 “怎么 找 ”, 从 而 方便 了 用 户 ,提高 了 数据 的 独立 性 。 


3. 完整 性 约束 


完整 性 约束 是 一 组 完整 的 数据 约束 规则 , 它 规定 了 数据 模型 中 的 数据 必须 符合 的 条 
件 , 对 数据 做 任何 操作 时 都 必须 保证 符合 约束 条 件 。 关 系 的 完整 性 约束 条 件 包括 三 大 类 
实体 完整 性 、 参 照 完整 性 和 用 户 定义 的 完整 性 。 其 具体 含义 将 在 后 面 介 绍 。 


4. 关系 模型 的 存储 结构 


关系 模型 的 数据 独立 性 最 高 ,用 户 基本 上 不 能 干预 物理 存储 。 在 关系 模型 中 ,实体 及 
实体 间 的 联系 都 用 表 来 表示 。 在 数据 库 的 物理 组 织 中 , 表 以 文件 的 形式 存储 ,有 的 系统 一 
个 表 对 应 于 一 个 操作 系统 文件 ,有 的 系统 一 个 数据 库 中 所 有 的 表 对 应 于 一 个 或 多 个 操作 
系统 文件 ,有 的 系统 自己 设计 文件 结构 。 


9.3.6 面向 对 象 模型 


随 着 计算 机 技术 的 发 展 ,计算 机 的 应 用 领域 不 断 扩 大 ,由 科学 计算 到 企业 资源 管理 ， 
到 工程 设计 领域 ,如 计算 机 辅助 设计 (CAD) ,计算 机 辅助 制造 (CAM) 、 多 媒体 应 用 、 人 工 
智能 等 领域 ,这 些 新 的 领域 ,对 数据 库 技 术 提 出 了 许多 非 传统 的 应 用 要 求 。 

(1) 存储 和 管理 大 量 复杂 的 数据 和 实体 ,如 多 媒体 数据 、 图 形 图 像 数 据 、 超 文本 数据 、 
空间 数据 和 时 态 数据 等 。 这 些 复杂 的 数据 类 型 是 关系 数据 库 中 不 能 完全 支持 的 。 

(2) 保留 设计 的 历史 和 设计 的 版 本 数据 。 在 工程 设计 过 程 中 ,一 个 设计 部 件 会 有 多 种 
设计 阶段 ,每 个 设计 阶段 又 会 有 多 个 不 同 的 设计 方案 ,每 个 设计 方案 又 可 产生 不 同 的 设计 修 
订 版 。 为 了 支持 工程 设计 过 程 的 反复 性 和 试探 性 设计 ,需要 保留 每 个 设计 对 象 的 多 个 版 本 。 

(3) 存储 大 量 标准 部 件 和 工程 数据 。 存 储 大 量 国标 或 部 标的 标准 数据 及 工程 设计 要 
求 . 规 范 等 数据 。 

(4) 随 着 工程 设计 的 进展 ,设计 对 象 的 模型 结构 也 会 有 变化 ,数据 模型 要 能 动态 地 修 
改 等 。 
SQL 是 一 种 非 过 程 化 的 面向 集合 的 语言 ,高 级 程序 设计 语言 是 过 程 化 的 、 面 向 单个 
数据 的 语言 ,导致 应 用 程序 语言 与 数据 库 管理 系统 对 数据 类 型 支持 的 不 一 致 问题 , 称 为 阻 
抗 失 配 。 面 向 对 象 数据 库 解决 了 阻抗 失 配 问题 ,强调 高 级 程序 设计 语言 与 数据 库 的 无 缝 
连接 。 面 向 对 象 数据 库 支 持 面向 对 象 数据 模型 。 面 向 对 象 数据 模型 是 用 面向 对 象 观点 来 
描述 现实 世界 实体 的 逻辑 组 织 ` 对 象 间 限 制 .联系 等 的 模型 。 一 个 面向 对 象 数据 库 系统 是 
一 个 持久 的 、 可 共享 的 对 象 库 的 存储 和 管理 者 ;而 一 个 对 象 库 是 由 一 个 面向 对 象 模型 所 定 
义 的 对 象 的 集合 体 。 

面向 对 象 的 数据 模型 是 新 一 代数 据 库 系统 的 基础 ,是 数据 库 技术 发 展 的 方向 。 面 向 
对 象 数据 模型 中 的 基本 数据 结构 是 对 象 ,一 个 对 象 由 一 组 属性 和 一 组 方法 组 成 。 该 模型 
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主要 具有 以 下 优点 。 

(1) 能 有 效 地 表达 客观 世界 和 有 效 地 查询 信息 。 

面向 对 象 方法 综合 了 在 关系 数据 库 中 发 展 的 全 部 工程 原理 .系统 分 析 、 软 件 工程 和 专 
家 系统 领域 的 内 容 。 面 向 对 象 的 方法 符合 一 般 人 的 思维 规律 ,即将 现实 世界 分 解 成 明确 
的 对 象 ,这 些 对 象 具有 属性 和 行为 。 

(2) 可 维护 性 好 。 

在 耦合 性 和 内 聚 性 方面 ,面向 对 象 数据 库 的 性 能 尤为 突出 。 这 使 得 数据 库 设计 者 可 
在 尽 可 能 少 影 响 现存 代码 和 数据 的 条 件 下 修改 数据 库 结构 。 这 种 先进 的 耦合 性 和 内 聚 性 
也 简化 了 在 异 构 硬 件 平台 网 络 上 的 分 布 式 数据 库 的 运行 。 

(3) 能 很 好 地 解决 阻抗 失 配 问题 。 

随 着 新 的 应 用 领域 的 要 求 ,在 20 世纪 80 年 代 后 期 出 现 了 支持 面向 对 象 数据 模型 的 
面向 对 象 数据 库 管理 系统 OODBMS, 已 经 商品 化 的 OODBMS 有 ObjectStore、.ONTOS、 
Versant、GemStore 等 。 面 向 对 象 数据 库 技术 正在 沿 着 以 下 三 种 途径 发 展 。 

(1) 面向 对 象 数 据 库 管理 系统 (OODBMS)。 

OODBMS 以 一 种 面向 对 象 语言 为 基础 ,增加 数据 库 的 功能 ,主要 支持 持久 对 象 和 实 
现 数据 共享 。 利 用 类 来 描述 复杂 对 象 ,利用 封装 方法 来 模拟 对 象 行为 ,利用 继承 性 来 实现 
对 象 的 结构 和 方法 的 重用 。 但 是 这 种 纯粹 的 面向 对 象 数据 库 管理 系统 不 能 支持 SQL ,不 
能 和 现 有 的 数据 库 结合 起 来 ,在 扩展 性 和 通用 性 方面 受到 限制 。 

(2) 对 象 关系 数据 库 管理 系统 (ORDBMS)。 

ORDBMS 既 支 持 SQL 语句 ,也 支持 面向 对 象 技 术 , 实 现 了 传统 数据 库 技术 和 面向 对 
象 技 术 的 完美 结合 。 全 球 的 数据 库 生 产 商 争 相 研 发 这 种 数据 库 产品 ,数据 库 生 产 商 竞 争 
的 一 个 焦点 是 如 何在 现 有 的 数据 库 中 加 入 面向 对 象 技术 。 

(3) 对 象 关 系 映射 数据 库 系统 (ORMDBMS)。 

ORMDBMS 在 对 象 层 和 关系 层 之 间 建 立 一 个 映射 层 , 使 得 数据 源 中 的 关系 数据 能 够 
进入 对 象 领域 ,并且 作 为 对 象 供 上 层 应 用 使 用 。 

目前 ,面向 对 象 数据 库 系 统 仍 有 以 下 问题 需要 解决 。 

(1) 技术 还 不 成 熟 。 

面向 对 象 数据 库 技 术 的 根本 缺点 是 这 项 技术 还 不 成 熟 , 鲜 为 人 知 。 与 许多 新 技术 一 
样 ,风险 就 在 于 应 用 。OODBMS 如 今 还 存在 着 标准 化 问题 ,由 于 缺乏 标准 化 ,许多 不 同 
的 OODBMS 之 间 不 能 通用 。 此 外 ,是 否 修改 SQL 以 适应 面向 对 象 的 程序 ,还 是 用 新 的 
对 象 查询 语言 来 代替 它 ,目前 还 没有 解决 。 这 些 因素 表 明 随 着 标准 化 的 出 现 ,OODBMS 

(2) 面向 对 象 技术 需要 一 定 的 训练 时 间 。 

人 们 还 需要 学 习 一 套 新 的 开发 方法 使 之 与 现 有 技术 相 结合 。 此 外 ,面向 对 象 系统 开 
发 的 有 关 原 理 才 初 具 雏 形 ,还 需 一 段 时 间 在 可 靠 性 .成 本 等 方面 令 人 可 接受 。 

(3) 理论 还 需 完善 。 

需要 设计 出 坚实 的 演算 或 理论 方法 来 支持 OODBMS 的 产品 。 此 外 , 既 不 存在 一 套 
数据 库 设 计 方法 学 ,也 没有 关于 面向 对 象 分 析 的 一 套 清 晰 的 概念 模型 ,怎样 设计 独立 于 物 
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理 存储 的 信息 还 不 明确 。 


9.4 数据 库 系 统 的 结构 


数据 库 管 理 系统 是 一 些 互相 关联 的 数据 以 及 一 组 支持 用 户 可 以 访问 和 更 新 这 些 数据 
的 程序 的 集合 。 数 据 库 管理 系统 的 一 个 主要 目的 就 是 隐藏 关于 数据 存储 和 维护 的 某 些 细 
节 ,为 用 户 提供 数据 在 不 同 层次 上 的 视图 , 即 数据 抽象 ,以 方便 不 同 的 使 用 者 可 以 从 不 同 
的 角度 去 考查 数据 库 系统 的 结构 和 利用 数据 库 中 的 数据 。 

从 数据 库 管理 系统 的 角度 看 ,数据库 系统 通常 采用 三 级 模式 结构 ,这 是 数据 库 系 统 内 
部 的 体系 结构 。 从 数据 库 最 终 用 户 的 角度 看 ,数据 库 系统 的 结构 分 为 主 从 式 结构 、 分 布 式 
结构 .客户 机 /服务 器 结构 和 浏览 器 /服务 器 结构 ,这 是 数据 库 系统 外 部 的 体系 结构 。 


9.4.1 数据 库 系统 的 三 级 模式 结构 


数据 库 中 的 数据 是 被 广大 用 户 使 用 的 ,任何 用 户 都 不 希望 自己 面 对 数 据 的 逻辑 结构 
发 生变 化 (数据 可 以 变化 ,如 学 生 的 年 龄 从 20 变 到 21) ,否则 ,应 用 程序 就 必须 重 写 。 即 
使 数据 的 存储 介质 发 生变 化 ,单个 用 户 所 面 对 数 据 的 逻辑 结构 也 不 能 发 生变 化 。 

数据 库 中 ,整体 数据 的 逻辑 结构 ,存储 结构 的 需求 发 生变 化 是 有 可 能 的 .正常 的 ,有 时 
也 是 必需 的 。 而 单个 用 户 不 希望 自己 面 对 的 局 部 数据 的 逻辑 结构 发 生变 化 也 是 合理 的 。 
因此 ,各 实际 的 数据 库 管理 系统 虽然 使 用 的 环境 不 同 , 内 部 数据 的 存储 结构 不 同 , 使 用 的 
语言 也 不 同 , 但 对 于 数据 ,一 般 都 采用 三 级 模式 结构 。 


1. 数据 模式 


在 数据 模型 中 有 “型 "(Type) 和 “ 值 ”*(Value) 的 概念 。 型 是 对 某 一 类 数据 的 结构 和 属 
性 的 说 明 , 值 是 型 的 一 个 具体 赋值 。 例 如 ,学 生 记录 定义 为 (学 号 ,姓名 ,性 别 , 系 别 , 年 
龄 ) , 称 为 记录 型 ,而 (201823060, 张 立 , 男 ,计算 机 ,20) 则 是 该 记录 型 的 一 个 记录 值 。 

模式 (Schema) 是 数据 库 中 全 体 数据 的 逻辑 结构 和 特征 的 描述 。 它 仅仅 涉及 型 的 描 
述 ,不 涉及 具体 的 值 。 某 数据 模式 下 的 一 组 具体 的 数据 值 称 为 数据 模式 的 一 个 实例 
(Instance)。 因 此 ,模式 是 稳定 的 ,而 实例 是 不 断 变 化 的 、 不 断 更 新 的 。 模 式 反 映 的 是 数 
据 的 结构 及 其 联系 ,而 实例 反映 的 是 数据 库 在 某 一 时 刻 的 状态 。 


2. 数据 库 系 统 的 三 级 模式 结构 


通常 DBMS 把 数据 库 从 逻辑 上 分 为 三 级 , 即 外 模式 、 模 式 和 内 模式 ,它们 分 别 反映 了 
看 待 数据 库 的 三 个 角度 。 三 级 模式 结构 如 图 9. 18 所 示 。 

为 了 支持 三 级 模式 ,DBMS 必须 提供 在 这 三 级 模式 之 间 的 两 级 映像 : 外 模式 /模式 映 
像 与 模式 /内 模式 映像 。 

1) 模式 

模式 (Schema) 也 称 为 逻辑 模式 (Logical Schema) ,对 应 于 人 逻辑 层 数 据 抽象 ,是 数据 库 
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应 用 A 应 用 B 应 用 C 应 用 D 


外 模式 |] 


外 模式 /模式 映像 


| 模式 


模式 /内 模式 映像 


内 模式 


a 


图 9.18 数据 库 系 统 的 三 级 模式 结构 


中 全 体 数据 的 逻辑 结构 和 特征 的 描述 。 模 式 处 于 三 级 结构 的 中 间 层 , 它 是 整个 数据 库 实 
际 存储 的 抽象 表示 ,也 是 对 现实 世界 的 一 个 抽象 ,是 现实 世界 某 应 用 环境 (企业 或 单位 ) 的 
所 有 信息 内 容 集合 的 表示 ,也 是 所 有 用 户 的 公共 数据 视图 。 

一 个 数据 库 只 有 一 个 模式 。 数 据 库 模式 以 某 一 种 数据 模型 为 基础 ,综合 考虑 了 所 有 
用 户 的 需求 ,并 将 这 些 需求 有 机 地 结合 成 一 个 逻辑 整体 。 定 义 模式 时 不 仅 要 定义 数据 的 
逻辑 结构 (如 数据 记录 由 哪些 项 组 成 ,数据 项 的 名 字 、 类 型 . 取 值 范围 等 ) ,而 且 要 定义 与 数 
据 有 关 的 安全 性 、 完 整 性 要 求 ,定义 数据 之 间 的 联系 。 

DBMS 提供 模式 描述 语言 (模式 DDL) 来 严格 地 定义 模式 。 

2) 外 模式 

外 模式 (External Schema) 又 称 子 模式 (Subschema) 或 用 户 模 式 , 是 三 级 结构 的 最 外 
层 , 也 是 最 靠近 用 户 的 一 层 , 反 映 数 据 库 用 户 看 待 数据 库 的 方式 ,是 模式 的 某 一 部 分 的 抽 
象 表 示 。 它 是 数据 库 用 户 (程序 员 和 最 终 用 户 ) 看 见 和 使 用 的 局 部 数据 的 好 辑 结构 和 特征 
的 描述 ,是 数据 库 用 户 的 数据 视图 ,是 与 某 一 应 用 有 关 的 数据 的 逻辑 表示 。 

它 由 多 种 外 记录 值 构成 ,这 些 记录 值 是 概念 视图 的 某 一 部 分 的 抽象 表示 , 即 个 别 用 户 
看 到 和 使 用 的 数据 库 内 容 ,也 称 * 用 户 数据 库 ”。 

外 模式 通常 是 模式 的 子 集 。 一 个 数据 库 可 以 有 多 个 外 模式 。 由 于 它 是 各 个 用 户 的 数 
据 视 图 ,如 果 不 同 的 用 户 在 应 用 需求 ,看 待 数据 的 方式 .对 数据 保密 的 要 求 等 方面 存在 差 
异 , 则 其 外 模式 描述 就 是 不 同 的 。 每 个 用 户 只 能 调用 他 的 外 模式 所 涉及 的 数据 ,其 余 的 数 
据 他 是 无 法 访问 的 。 

DBMS 提供 子 模式 描述 语言 ( 子 模式 DDL) 来 定义 子 模式 。 

3) 内 模式 

内 模式 (Internal Schema) 又 称 为 存储 模式 (Storage Schema) 或 内 视图 ,是 三 级 结构 
中 的 最 内 层 ,也 是 靠近 物理 存储 的 一 层 , 即 与 实际 存储 数据 方式 有 关 的 一 层 ,由 多 个 存储 
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记录 组 成 ,但 并 非 物 理 层 , 不 必 关 心 具体 的 存储 位 置 。 一 个 数据 库 只 有 一 个 内 模式 。 它 是 
数据 物理 结构 和 存储 方式 的 描述 ,是 数据 在 数据 库 内 部 的 表示 方式 。 如 记录 的 存储 方式 
是 顺序 存储 还 是 Hash 方法 存储 ;数据 是 否 压缩 存储 ,是 否 加 密 等 。 

DBMS 提供 内 模式 描述 语言 (内 模式 DDL) 来 描述 和 定义 内 模式 。 

在 数据 库 系 统 中 ,外 模式 可 以 有 多 个 ,而 概念 模式 、 内 模式 只 能 各 有 一 个 。 

内 模式 是 整个 数据 库 实 际 存储 的 表示 ,而 概念 模式 是 整个 数据 库 实 际 存储 的 抽象 表 
示 , 外 模式 是 概念 模式 的 某 一 部 分 的 抽象 表示 。 

根据 数据 抽象 的 三 个 不 同 级 别 , 可 方便 不 同 用 户 使 用 数据 库 的 需要 。 数 据 库 的 三 级 
模式 结构 的 优点 如 下 。 

(1) 保证 数据 的 独立 性 。 将 外 模式 和 模式 分 开 , 保 证 了 数据 的 逻辑 独立 性 ;将 模式 和 
内 模式 分 开 , 保 证 了 数据 的 物理 独立 性 。 

(2) 有 利于 数据 共享 。 在 不 同 的 外 模式 下 可 有 多 个 用 户 共享 系统 中 的 数据 ,减少 了 
数据 元 余 。 

(3) 简化 了 用 户 接 口 。 按 照 外 模式 编写 应 用 程序 或 输入 命令 ,而 无 须 了 解数 据 库 内 
部 的 存储 结构 ,方便 用 户 使 用 系统 。 

(4) 利于 数据 的 安全 保密 。 在 外 模式 下 根据 要 求 进行 操作 ,不 能 对 限定 的 数据 操作 ， 
保证 了 其 他 数据 的 安全 。 


9.4.2 数据 库 系统 的 二 级 映像 


数据 库 系统 的 三 级 模式 是 对 数据 的 三 个 抽象 级 别 , 它 使 用 户 能 逻辑 地 、 抽 象 地 处 理 数 
据 ,而 不 必 关 心 数 据 在 计算 机 内 部 的 存储 方式 ,把 数据 的 具体 组 织 交 给 DBMS 管理 。 为 
了 能 够 在 内 部 实现 这 三 个 抽象 层次 的 联系 和 转换 ,DBMS 在 三 级 模式 之 间 提 供 了 二 级 映 
像 (外 模式 /模式 映像 和 模式 /内 模式 映像 ) 功 能 。 这 两 层 映 像 , 使 数据 库 系 统 中 的 数据 具 
有 较 高 的 逻辑 独立 性 和 物理 独立 性 。 


1. 外 模式 /模式 映像 


外 模式 描述 的 是 数据 的 局 部 逻辑 结构 ,而 模式 描述 的 是 数据 的 全 局 逻辑 结构 。 数 据 
库 中 的 同一 模式 可 以 有 任意 多 个 外 模式 ,对 于 每 一 个 外 模式 ,都 存在 一 个 外 模式 /模式 映 
像 。 它 确定 了 数据 的 局 部 逻辑 结构 与 全 局 逻辑 结构 之 间 的 对 应 关系 。 这 些 映 像 定 义 通常 
包含 在 各 自 外 模式 的 描述 中 。 

当 模 式 改变 时 (例如 改变 了 关系 的 结构 ,改变 了 关系 或 属性 的 名 称 ,改变 了 属性 的 数 
据 类 型 等 ), 由 数据库 管 理 员 对 各 个 外 模式 /模式 的 映像 做 相应 的 改变 ,可 以 使 外 模式 保持 
不 变 。 应 用 程序 是 依据 数据 的 外 模式 编写 的 ,从 而 应 用 程序 不 必修 改 , 保 证 了 数据 与 应 用 
程序 的 逻辑 独立 性 ,简称 为 数据 的 逻辑 独立 性 。 


2. 模式 /内 模式 映像 
数据 库 中 的 模式 和 内 模式 都 只 有 一 个 ,所 以 模式 /内 模式 映像 是 唯一 的 。 它 确定 了 数 
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据 的 全 局 逻辑 结构 与 存储 结构 之 间 的 对 应 关系 。 例 如 ,说 明 逻 辑 记录 和 字段 在 内 部 是 如 
何 表示 的 。 该 映像 定义 通常 包含 在 模式 描述 中 。 当 数据 库 的 存储 结构 改变 了 ,由 数据 库 
管理 员 对 模式 /内 模式 映像 做 相应 的 改变 ,可 以 使 模式 保持 不 变 ,从 而 应 用 程序 也 不 必修 
改 , 保 证 了 数据 域 应 用 程序 的 物理 独立 性 ,简称 为 数据 库 的 物理 独立 性 。 

总 之 ,一 方面 ,由 于 数据 与 应 用 程序 之 间 的 独立 性 ,使 得 数据 的 定义 和 描述 可 以 从 应 
用 程序 中 分 离 出 来 ; 男 一 方面 ,由 于 数据 的 存 取 由 DBMS 管理 ,用 户 不 必 考 虑 存 取 路 径 等 
细节 ,从 而 大 大 简化 了 应 用 程序 的 编制 ,也 大 大 提高 了 应 用 程序 维护 和 修改 的 效率 。 


9.4.3 数据 库 体 系 结构 


三 级 模式 结构 是 数据 库 系统 最 本 质 的 系统 结构 , 它 是 从 数据 结构 的 角度 看 待 问题 的 。 
用 户 是 以 数据 库 系统 的 服务 方式 看 待 数据 库 系统 ,这 是 数据 库 的 软件 体系 结构 。 以 数据 
库 最 终 用 户 的 观点 ,数据 库 系统 的 结构 分 为 单机 结构 、 主 从 式 结构 .分布 式 结构 、 客 户 机 / 
服务 器 结构 和 浏览 器 /服务 器 结构 。 


1. 单机 结构 


单机 数据 库 就 是 只 能 运行 在 单 台 PC 上 ,因而 适合 未 联网 用 户 、 个 人 用 户 等 ,如 
图 9.19 所 示 。 目 前 比较 流行 的 单机 结构 DBMS 有 Microsoft Access、Visual FoxPro 等 。 


2. 主 从 式 结构 


主 从 式 结构 是 指 一 台 主机 带 上 多 个 用 户 终端 的 数据 库 系 统 ,如 图 9. 20 所 示 。 终 端 一 
般 只 是 主机 的 扩展 ,它们 并 不 是 独立 的 计算 机 。 终 端 本 身 并 不 能 完成 任何 操作 ,它们 依赖 
主机 完成 所 有 的 操作 。 


应 用 程序 
小 型 计算 机 全 汪汪 I 
DBMS 


图 9.19 单机 结构 图 9.20 主 从 式 结构 


在 主 从 式 结构 中 ,DBMS、DB、 应 用 程序 都 是 集中 存放 在 主机 上 的 ,有 一 个 CPU .一 个 
操作 系统 支持 。 用 户 通 过 终端 并 发 地 访问 主机 上 的 数据 ,共享 其 中 的 数据 ,但 所 有 处 理 数 
据 的 工作 都 由 主机 完成 。 用 户 若 在 一 个 终端 上 提出 要 求 , 主 机 将 根据 用 户 的 要 求 访问 数 
据 库 ,并 对 数据 进行 处 理 ,再 把 结果 回 送 该 终端 输出 。 
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主 从 式 结构 的 优点 是 简单 .可靠 .安全 。 它 的 缺点 是 主机 的 任务 繁重 ,终端 数 有 限 , 且 
当主 机 出 现 故障 时 ,整个 系统 就 不 能 使 用 了 。 主 从 式 是 数据 库 系 统 初期 最 流行 的 结构 , 随 
着 计算 机 网 络 的 兴起 和 PC 性 能 的 大 幅 提 高 且 价 格 又 大 幅 降低 ,这 种 传统 的 主 从 式 数据 
库 系统 结构 已 经 被 取代 。 


3. 分 布 式 结构 


分 布 式 数 据 库 是 一 组 结构 化 的 数据 集合 ,它们 在 逻辑 上 属于 同一 系统 而 在 物理 上 分 
布 在 计算 机 网 络 的 不 同 结 点 上 ,如 图 9. 21 所 示 。 网 络 中 的 各 个 结 点 (也 称 为 “场地 ”) 一 般 
都 是 集中 式 数据 库 系统 ,由 计算 机 、 数 据 库 和 若干 终端 组 成 。 


应 用 程序 
1 
DBMS 


应 用 程序 


~ DBMS 
i 1 


图 9.21 分 布 式 结构 


分 布 式 数据 库 的 数据 具有 “分 布 性 ”的 特点 ,数据 库 中 的 数据 不 是 存储 在 同一 场地 ,而 
是 在 物理 上 分 布 在 各 个 场地 ,这 也 是 它 与 集中 式 数据 库 的 最 大 区 别 。 分 布 式 数据 库 的 数 
据 具 有 “逻辑 整体 性 ”, 分 布 在 各 地 的 数据 逻辑 上 是 一 个 整体 ,由 各 计算 机 区 域 自治 ,计算 
机 之 间 通 过 网 络 联系 起 来 ,用 户 使 用 起 来 如 同一 个 集中 式 数据 库 , 这 是 它 与 分 散 式 数据 库 
的 区 别 。 


4. 客户 机 /服务 器 结构 


在 客户 机 /服务 器 结构 中 ,同样 需要 一 台 主 计算 机 (服务 器 ) ,一 台 或 多 台 个 人 计算 机 
(客户 机 ) 通 过 网 络 连接 到 服务 ,如 图 9. 22 所 示 。 数 据 库 运行 在 服务 器 上 ,访问 服务 器 数 
据 库 的 每 一 个 用 户 都 需要 有 自己 的 PC。 当 用 户 提出 数据 请 求 后 ,服务 器 不 仅 会 检索 出 文 
件 , 而 且 对 文件 进行 操作 ,然后 只 向 客户 机 发 送 查询 的 结果 而 不 是 整个 文件 。 客 户 机 再 根 
据 用 户 对 数据 的 要 求 , 对 数据 做 进一步 的 加 工 。 

在 客户 机 /服务 器 结构 中 ,网 络 上 的 数据 传输 量 已 明显 减少 ,从 而 提高 了 系统 的 性 能 。 
另外 ,客户 机 的 硬件 平台 和 软件 平台 也 可 多 种 多 样 , 从 而 为 应 用 带 来 了 方便 。 

客户 机 /服务 器 结构 在 技术 上 非常 成 熟 ,具有 强大 的 数据 操作 和 事务 处 理 能 力 。 该 结 
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DBMS 


客户 机 (人 事 系统 ) 客户 机 (后 勤 系统 ) 
图 9.22 客户 机 /服务 器 结构 


构 模 型 思想 简单 ,易于 被 人 们 理解 和 接受 。 它 的 主要 特点 是 交互 性 强 , 具 有 安全 的 存 取 模 
式 ,网 络 通信 量 低 ,响应 速度 快 , 有 利于 处 理 大量 数 据 。 


5. 浏览 器 /服务 器 结构 


浏览 器 /服务 器 结构 是 随 着 Internet 技术 的 兴起 而 兴起 的 ,是 对 客户 机 /服务 器 结构 
的 改良 。 在 这 种 结构 下 ,客户 工作 界面 通过 WWW 浏览 器 来 实现 ,提供 的 服务 有 信息 浏 
览 . 电 子 邮 件 、 会 议 , 发 送 接收 文件 等 ,网 络 间 通 过 公共 协议 (TCP/IP) 通 信 。 

如 图 9. 23 所 示 , Web 是 一 个 基于 超 媒 体 的 信息 网 络 , Web 中 的 计算 机 有 两 种 角色 : 
客户 机 (浏览 器 ) 和 服务 器 。 作 为 服务 器 可 以 提供 信息 ,作为 客户 机 可 以 浏览 和 请 求 信息 。 
服务 器 与 浏览 器 间 通 过 HTTP 交换 信息 。 用 户 通过 浏览 器 向 分 布 在 网 络 上 的 Web 服务 
器 发 出 请 求 , Web 服务 器 对 浏览 器 的 请 求 进行 处 理 , 若 涉及 访问 数据 库 中 的 数据 , 则 由 
Web 服务 器 向 数据 库 服务 器 发 出 请 求 。 数 据 库 服务 器 接收 到 请 求 并 处 理 , 将 处 理 后 的 数 
据 或 状态 返回 给 Web 服务 器 ,再 由 Web 服务 器 对 数据 进行 加 工 处 理 , 生 成 动态 网 页 返回 
到 客户 的 浏览 器 中 。 


Web 应 用 程序 
1 
DBMS 
I 


计算 机 A 工作 站 \ 数据 库 


S 


计算 机 计算 机 
图 9.23 浏览 器 /服务 器 结构 
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在 浏览 器 /服务 器 结构 中 ,客户 端 只 需要 安装 一 个 浏览 器 即 可 ,不 需要 加 载 任何 应 用 
软件 。 目 前 ,Windows 系列 操作 系统 内 置 了 IE 浏览 器 软件 ,这 就 使 得 客户 可 以 在 任何 地 
方 通过 Internet 访问 企业 中 的 数据 ,所 有 对 数据 库 的 访问 和 应 用 程序 的 执行 都 由 Web 服 
务 器 完成 。 

实际 上 ,浏览 器 /服务 器 结构 是 把 客户 机 /服务 器 的 事务 处 理 逻辑 模块 从 客户 机 的 任 
务 中 分 离 出 来 ,由 Web 服务 器 单独 组 成 一 层 来 承担 其 任务 ,把 负荷 分 配给 了 Web 服务 
器 ,这 样 客户 机 的 压力 就 减轻 了 。 这 种 结构 不 仅 将 客户 机 从 沉重 的 负担 和 不 断 提 高 其 性 
能 的 要 求 中 解放 出 来 ,也 将 技术 维护 人 员 从 繁重 的 维护 升级 工作 中 解脱 出 来 。 由 于 客户 
机 把 事务 处 理 逻 辑 部 分 交 给 了 服务 器 ,使 得 客户 机 一 下 子 “ 苗 条 ”了 许多 ,不 再 负责 处 理 复 
杂 计 算 和 数据 访问 等 关键 事务 ,而 只 负责 输入 和 显示 部 分 ,所 以 维护 人 员 不 必 为 维护 程序 
奔波 于 各 个 客户 机 之 间 ,而 只 需要 把 主要 精力 放 在 功能 服务 器 程序 的 更 新 工作 上 ,这 种 结 
构 各 层 相互 独立 ,任何 一 层 的 改变 都 不 影响 其 他 层 的 功能 。 


9.5 数据 库 管 理 系统 


9.5.1 DBMS 的 工作 模式 
数据 库 管理 系统 是 对 数据 进行 管理 的 软件 系统 , 它 是 数据 库 系 统 的 核心 组 成 部 分 ,用 


户 在 数据 库 系 统 中 的 一 切 操作 ,包括 数据 定义 ,查询 .更 新 及 各 种 控制 ,都 是 通过 DBMS 
进行 的 。DBMS 的 工作 模式 如 图 9. 24 所 示 。 


应 用 程序 


数据 请 求 


数据 
处 理 结果 
图 9.24 DBMS 的 工作 模式 


DBMS 的 工作 模式 如 下 。 

(1) 接受 应 用 程序 的 数据 请 求 和 处 理 请 求 。 

(2) 将 用 户 的 数据 请 求 转 换 成 复杂 的 机 器 代码 。 

(3) 实现 对 数据 库 的 操作 。 

(4) 从 对 数据 库 的 操作 中 接收 查询 结果 。 

(5) 对 查询 结果 进行 处 理 。 

(6) 将 处 理 结果 返回 给 用 户 。 

DBMS 总 是 基于 某 种 数据 模型 ,因此 可 以 把 DBMS 看 成 是 某 种 数据 模型 在 计算 机 系 
统 上 的 具体 实现 。 根 据 数 据 模型 的 不 同 ,DBMS 可 以 分 成 层次 型 .网 状 型 .关系 型 .面向 
对 象 型 等 。 在 不 同 的 计算 机 系统 中 ,由 于 缺乏 统一 的 标准 ,即使 是 同 种 数据 模型 的 
DBMS ,在 用 户 接口 .系统 功能 等 方面 也 常常 是 不 相同 的 。 

为 了 使 读者 对 数据 库 系 统 的 工作 有 一 个 整体 的 概念 , 现 以 查询 为 例 , 介 绍 访问 数据 库 
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的 主要 步骤 ,该 过 程 如 图 9. 25 所 示 。 


应 用 程序 
工作 区 


系统 缓冲 


一 全 


模式 


奖 改 雍 潍 


内 模式 


图 9.25 访问 数据 库 的 步骤 


(1) 当 执 行 应 用 程序 中 一 条 查询 数据 库 的 记录 时 , 则 向 DBMS 发 出 读 取 相 应 记录 的 
命令 ,并 指明 外 模式 名 。 

(2) DBMS 接 到 命令 后 , 调 出 所 需 的 外 模式 ,并 进行 权限 检查 ; 若 合 法 , 则 继续 执行 ; 
否则 向 应 用 程序 返回 出 错 信 息 。 

(3) DBMS 访问 模式 ,并 根据 外 模式 /模式 映像 ,确定 所 需 数据 在 模式 上 的 有 关 信 息 
(逻辑 记录 型 ) 。 

(4) DBMS 访问 内 模式 ,并 根据 模式 /内 模式 映像 ,确定 所 需 数据 在 内 模式 上 的 有 关 
信息 ( 读 取 的 物理 记录 及 存 取 方法 )。 

(5) DBMS 向 操作 系统 发 出 读 相应 数据 的 请 求 ( 读 取 记录 )。 

(6) 操作 系统 执行 读 命令 ,将 有 关 数 据 从 外 存 调 入 到 系统 缓冲 区 上 。 

(7) DBMS 把 数据 按 外 模式 的 形式 送 入 用 户 工 作 区 ,返回 正常 执行 的 信息 。 

这 样 ,用户 程序 即 可 以 使 用 数据 了 。 当 然 , 这 仅仅 是 几 个 大 的 步骤 ,并 未 涉及 有 关 细 
节 。 从 上 述 可 知 ,DBMS 是 数据 库 系统 的 核心 , 且 和 操作 系统 有 关 。 


9.5.2 DBMS 的 主要 功能 


DBMS 的 主要 功能 有 以 下 几 个 方面 。 
1. 数据 库 定义 功能 


DBMS 提供 数据 定义 语言 (Data Define Language,DDL) ,用 于 定义 数据 的 模式 、 外 模 
式 和 内 模式 三 级 模式 结构 ,定义 模式 /内 模式 和 外 模式 /模式 二 级 映像 ,以 及 定义 有 关 的 约 
东 条 件 。 

例如 ,为 保证 数据 库 安全 而 定义 的 用 户口 令 和 存 取 权限 ,为 保证 正确 语义 而 定义 的 完 
整 性 规则 。 


2. 数据 操纵 功能 


DBMS 提供 数据 操纵 语言 (Data Manipulation Language, DML) 实 现 对 数据 库 的 基 
本 操作 ,包括 检索 、 插 入 修改、 删除 等 。 
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SQL 就 是 DML 的 一 种 。 
3. 数据 组 织 、 存 储 和 管理 


DBMS 要 分 类 组 织 、 存 储 和 管理 各 种 数据 ,包括 数据 字典 、 用 户 数 据 、 数 据 的 存 取 路 
径 等 。 要 确定 以 何 种 文体 结构 和 存 取 方 式 在 存储 级 上 组 织 这 些 数 据 ,如 何 实现 数据 之 间 
的 联系 。 数 据 组 织 和 存储 的 基本 目标 是 提高 存储 空间 利用 率 和 方便 存 取 , 提供 多 种 存 取 
方法 。 

4. 数据 库 运 行 管理 功能 


数据 库 运 行 管理 的 功能 包括 以 下 4 个 方面 。 

(1) 数据 的 安全 性 控制 。 防 止 未 经 授权 的 用 户 存 取 数 据 库 中 的 数据 ,以 避免 数据 的 
泄漏 ,更改 或 破坏 。 

(2) 数据 的 完整 性 控制 。 保 证 数据 库 中 数据 及 语义 的 正确 性 和 有 效 性 ,防止 任何 可 
能 对 数据 造成 错误 的 操作 。 

(3) 多 用 户 环境 下 的 并 发 控制 。 在 多 个 用 户 同时 对 同一 个 数据 进行 操作 时 ,系统 应 
能 加 以 控制 ,防止 破坏 数据 库 中 的 数据 。 

(4) 数据 库 的 恢复 。 在 数据 库 被 破坏 或 数据 不 正确 时 ,系统 有 能 力 把 数据 库 恢 复 到 
正确 的 状态 。 


5. 数据 库 的 建立 和 维护 功能 


数据 库 的 建立 和 维护 功能 包括 数据 库 的 初始 数据 的 装 入 ,数据 库 的 转 储 、 恢 复 、 重 组 
织 , 系 统 性 能 监视 ,分析 等 功能 。 这 些 功 能 通常 是 由 一 些 实用 程序 完成 的 。 


6. 数据 通信 

DBMS 提供 与 其 他 软件 系统 进行 通信 的 功能 ,实现 用 户 程序 与 DBMS 之 间 的 通信 ， 
通常 与 操作 系统 协调 完成 。 
9.5.3 DBMS 的 组 成 


DBMS 是 一 个 复杂 的 软件 系统 ,是 由 许多 “系统 程序 ”所 组 成 的 一 个 集合 。 由 于 
DBMS 的 复杂 程度 不 同 , 这 些 程序 也 不 尽 相 同 ,一 般 按 程序 实现 的 功能 DBMS 可 分 为 以 
下 几 部 分 。 


1. 语言 编译 处 理 程序 


1) 数据 定义 语言 DDL 及 其 编译 程序 

它 把 用 DDL 编写 的 各 级 源 模 式 编译 成 各 级 目标 模式 ,这 些 目 标 模式 是 对 数据 库 结 构 
信息 的 描述 ,而 不 是 数据 本 身 ,它们 被 保存 在 数据 字典 中 , 供 以 后 数据 操纵 或 数据 控制 时 
使 用 。 
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2) 数据 操纵 语言 DML 及 其 编译 程序 
实现 对 数据 库 的 基本 操作 。DML 有 两 类 : 一 类 是 宿主 型 ,嵌入 在 高 级 语言 中 ,不 能 
单独 使 用 ; 另 一 类 是 自主 型 或 自 含 型 ,可 独立 地 交互 使 用 。 


2. 系统 运行 控制 程序 


系统 运行 控制 程序 主要 包括 以 下 几 部 分 。 

(1) 系统 总 控 程序 ,是 DBMS 运行 程序 的 核心 ,用 于 控制 和 协调 各 程序 的 活动 。 

(2) 安全 性 控制 程序 ,防止 未 被 授权 的 用 户 存 取 数据 库 中 的 数据 。 

(3) 完整 性 控制 程序 ,检查 完整 性 约束 条 件 ,确保 进入 数据 库 中 的 数据 的 正确 性 、 有 
效 性 和 相 容 性 。 

(4) 并 发 控制 程序 ,协调 多 用 户 、 多 任务 环境 下 各 应 用 程序 对 数据 库 的 并 行 操作 , 保 
证 数据 的 一 致 性 。 

(5) 数据 存 取 和 更 新 程序 ,实施 对 数据 库 数据 的 检索 、 插 入 、 修 改 、 删 除 等 操作 。 

(6) 通信 控制 程序 ,实现 用 户 程序 与 DBMS 间 的 通信 。 


3. 系统 建立 ,维护 程序 


系统 建立 维护 程序 主要 包括 以 下 几 部 分 。 
(1) 装配 程序 ,完成 初始 数据 库 的 数据 装 入 。 
(2) 重组 程序 , 当 数 据 库 系统 性 能 变 坏 时 (如 查询 速度 变 慢 ), 需 要 重新 组 织 数据 库 ， 


重新 装 人 数据 。 
(3) 系统 恢复 程序 , 当 数据 库 系统 受到 破坏 时 ,将 数据 库 系统 恢复 到 以 前 某 个 正确 的 
4. 数据 字典 


数据 字典 (Data Dictionary,DD) 中 到 底 应 包括 哪些 信息 ,并 没有 明确 的 规定 ,一 般 由 
DBMS 的 功能 强 弱 而 定 。 其 数据 主要 有 两 类 : 一 类 是 来 自用 户 的 信息 ,如 表 、 视 图 (用 户 
所 使 用 的 虚 表 ) 和 索引 的 定义 以 及 用 户 的 权限 等 ; 男 一 类 是 来 自 系统 状态 和 数据 库 的 统计 
信息 ,如 通信 系统 用 的 协议 .数据库 和 磁盘 的 映射 关系 .数据 使 用 的 频率 统计 等 。 


小 结 


本 章 概述 数据 库 的 基本 概念 ,并 通过 对 数据 管理 技术 发 展 的 三 个 阶段 的 介绍 ,阐述 了 
数据 库 技术 产生 和 发 展 的 背景 ,也 说 明了 数据 库 系统 的 优点 。 

(1) 描述 事物 的 符号 称 为 数据 。 数 据 库 是 长 期 存储 在 计算 机 内 有 组 织 的 共享 的 数据 
的 集合 。 数 据 库 管理 系统 是 由 一 个 相互 关联 的 数据 的 集合 和 一 组 用 以 访问 .管理 和 控制 
这 些 数据 的 程序 组 成 。 数 据 库 系统 是 指 在 计算 机 系统 中 引入 数据 库 后 的 系统 ,一 般 由 数 
据 库 .数据库 管 理 系统 (及 其 开发 工具 ) 应 用 系统 ,数据库 管理 员 和 用 户 构成 。 

(2) 数据 管理 技术 的 发 展 经 历 了 人 工 管理 阶段 ,文件 系统 阶段 ,数据库 系 统 阶 段 和 高 
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级 数据 库 阶段 。 

(3) 数据 模型 是 数据 库 系 统 的 核心 和 基础 。 数 据 模型 的 发 展 经 历 了 非 关 系 化 模型 
(层次 模型 .网 状 模型 ) 关系 模 型 ,正在 走向 面向 对 象 模型 。 数 据 模 型 通常 由 数据 结构 . 数 
据 操作 和 完整 性 约束 三 部 分 组 成 。 

(4) 概念 模型 也 称 信息 模型 ,用 于 信息 世界 的 建 模 ,E-R 模型 是 这 类 模型 的 典型 代 
表 ,E-R 模型 简单 .清晰 ,应 用 十 分 广泛 。 

(5) 关系 模型 是 目前 最 常用 的 一 种 数据 模型 。 关 系 可 形象 地 用 二 维 表 表 示 , 它 由 行 
和 列 组 成 。 

(6) 数据 库 系 统 中 ,数据 具有 三 级 模式 结构 的 特点 ,由 外 模式 、 模 式 、 内 模式 以 及 外 模 
式 /模式 映像 .模式 /内 模式 映像 组 成 。 三 级 模式 结构 使 数据 库 中 的 数据 具有 较 高 的 逻辑 
独立 性 和 物理 独立 性 。 一 个 数据 库 系 统 中 ,只 有 一 个 模式 ,一 个 内 模式 ,但 有 多 个 外 模式 。 
因此 ,模式 /内 模式 映像 是 唯一 的 ,而 每 一 个 外 模式 都 有 自己 的 外 模式 /模式 映像 。 

(7) 数据 库 系 统 的 结构 分 为 单机 结构 、 主 从 式 结构 ,分布 式 结构 ,客户 机 /服务 器 结构 
和 浏览 器 /服务 器 结构 。 

(8) 数据 库 系 统 实质 上 是 一 个 人 机 系统 ,人 的 作用 特别 是 DBA 的 作用 非常 重要 。 

学 习 这 一 章 应 把 注意 力 放 在 掌握 基本 概念 和 基本 知识 方面 ,为 进一步 学 习 后 面 的 章 
节 打 好 基础 。 


试 解释 DB.DBMS 和 DBS 三 个 概念 。 

人 工 管理 阶段 和 文件 系统 阶段 的 数据 管理 各 有 哪些 特点 ? 
数据 库 阶 段 的 数据 管理 有 哪些 特点 ? 

什么 是 E-R 模型 ? E-R 模型 的 主要 组 成 有 哪些 ? 

试 述 层 次 模型 的 概念 ,并 举例 说 明 。 

试 述 网 状 模型 的 概念 ,并 举例 说 明 。 

试 述 关系 模型 的 主要 术语 。 

DB 的 三 级 模式 结构 描述 了 什么 问题 ? 试 详细 解释 。 

试 述 DBMS 的 工作 模式 和 主要 功能 。 


= 
Co 和 NP 人 DoD- 
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第 10 章 ”关系 模型 与 关系 代数 


本 章 学 习 目 标 
。 理解 关系 代数 的 运算 。 
。 掌握 关系 的 定义 和 性 质 ,以 及 专门 的 关系 运算 方法 。 


由 于 目前 流行 的 数据 库 管理 系统 都 是 以 关系 模型 为 基础 实现 的 ,因此 ,本 章 主 要 介绍 
关系 数据 库 实现 的 基本 理论 。 关 系数 据 库 是 以 关系 数据 模型 为 基础 ,用 关系 表示 模型 ,用 
关系 运算 表示 数据 操作 ,因此 ,关系 数据 库 的 理论 是 严格 的 , 它 为 数据 的 组 织 和 管理 提供 
了 重要 的 理论 依据 。 


10.1 关系 模型 


由 于 关系 模型 建立 在 集合 代数 的 基础 上 ,因此 一 般 从 集合 角度 给 出 关系 数据 结构 的 


1. 关系 的 定义 和 性 质 


1) 第 卡 儿 积 
给 定 一 组 域 Di , D;,D;,… ,Dy, 则 Di XD; XD;X…XDy={(di,ds,ds3,*…,d,)| 
diEDi, i 二 1,2,…,n) 称 为 Di ,D;,D;,… ,Dw 的 笛 卡 儿 积 。 每 个 (di ,4d;,d;，,…,d,) 称 为 
一 个 元 组 ,元 组 中 的 每 个 d; 是 D; 域 中 的 一 个 值 , 称 为 一 个 分 量 。 当 一 1 时 , 称 为 单元 
组 ; 当 n=2 时 , 称 为 二 元 组 ;…… 
〖 例 10.1】 A={aiyazyassa},B=={b1,b2,b3},C 二 {ciscz), 则 A,B,C 的 笛 卡 儿 
积 为 ， 
AXBxC= 
{ Koais arsbesti)s Carsbyscs)s 
(aisbs sc1), (aisbs3 cz )，(az sDb1sc1), (az ,bic2), 
(az yb ,cl)，(az ,bz sc2), (az sb3sc1), (a ,bs ycz)， 
(as Di sc1), (as sD scs), (as sobs sc1), (as bs cz)， 
(as ,bs ,cl) (assbs ,cz ) ，(ai yb ycl)，(asypbiycz)， 
《ae 
2) 关系 
给 定 一 组 域 Di ,D;,D;,…, Dw, 则 D; X D; X D;X… XD 的 子 集 称 为 Di X D， x 
D;X…XDy 上 的 关系 , 记 作 
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RCD, ,D; ,D:,…,Dx) 
式 中 ,R 称 为 关系 名 ;N 称 为 关系 及 的 度数 。 
【 例 10.2】 男人 =={ 张 晓 , 王 和 , 李 东 ), 女 人 = { 刘 红 , 钱 丽 , 孙 倩 }, 则 男人 和 女人 的 
第 卡 儿 积 为 : 
男人 XX 女人 ={( 张 晓 , 刘 红 ) ,( 张 晓 , 钱 丽 ),( 张 晓 , 孙 倩 )， 
( 王 和 , 刘 红 ),( 王 和 , 钱 丽 ),( 王 和 , 孙 倩 )， 
( 李 东 , 刘 红 ) ,( 李 东 , 钱 丽 ),( 李 东 , 孙 倩 )} 
满足 夫妻 关系 为 上 述 笛 卡 儿 积 的 子 集 为 : 
夫妻 (男人 ,女人 )={( 张 晓 , 刘 红 ),( 王 和 , 钱 丽 ),( 李 东 , 孙 倩 )} 
【 例 10.3】 学 校 开设 了 一 些 课程 ,因此 有 集合 : 
课程 三 {( 高 等 数学 ,信息 专业 ) , (英语 ,信息 专业 ), (英语 ,人 文 专业 ), (文学 ,人 
文 专业 )} 
学 生 二 {20180001,20180002,20180003,20180011,20180012,20180013} 
则 学 生 和 课程 的 笛 卡 儿 积 为 : 
学 生 X 课 程 = 
{(20180001 ,高 等 数学 ,信息 专业 ),(20180001 ,英语 ,信息 专业 )， 
(20180001 ,英语 ,人 文 专业 ),(20180001, 文 学, 人文 专 业 )， 
(20180002 ,高 等 数学 ,信息 专业 ) ,(20180002 ,英语 ,信息 专业 )， 
(20180002 ,英语 ,人 文 专业 ),(20180002 ,文学 ,人 文 专业 )， 
(20180003 ,高 等 数学 ,信息 专业 ),(20180003 ,英语 ,信息 专业 )， 
(20180003 ,英语 ,人 文 专业 ),(20180003 ,文学 ,人 文 专业 )， 
(20180011 ,高 等 数学 ,信息 专业 ) ,(20180011 ,英语 ,信息 专业 )， 
(20180011 ,英语 ,人 文 专业 ),(20180011 ,文学 ,人 文 专业 )， 
(20180012 ,高 等 数学 ,信息 专业 ),(20180012 ,英语 ,信息 专业 )， 
(20180012 ,英语 ,人 文 专业 ),(20180012 ,文学 ,人 文 专业 ) ， 
(20180013 ,高 等 数学 ,信息 专业 ),(20180013 ,英语 ,信息 专业 )， 
(20180013 ,英语 ,人 文 专业 ),(20180013 ,文学 ,人 文 专业 )} 
假设 学 号 中 的 第 7 位 是 “0” 表 示 该 学 生 是 信息 专业 ,第 7 位 是 1” 表示 该 学 生 是 人 文 
专业 。 条 件 是 本 专业 学 生 只 能 选 本 专业 的 课程 , 则 学 生 选 课 关 系 为 ， 
学 生 选 课 一 
{(20180001 ,高 等 数学 ,信息 专业 ),(20180001 ,英语 ,信息 专业 )， 
(20180002 ,高 等 数学 ,信息 专业 ),(20180002 ,英语 ,信息 专业 )， 
(20180003 ,高 等 数学 ,信息 专业 ),(20180003 ,英语 ,信息 专业 )， 
(20180011 ,英语 ,人 文 专业 ),(20180011 ,文学 ,人 文 专业 )， 
(20180012 ,英语 ,人 文 专业 ) ,(20180012 ,文学 ,人 文 专业 )， 
(20180013 ,英语 ,人 文 专业 ),(20180013 ,文学 ,人 文 专业 )} 
用 二 维 表 来 表示 上 述 关 系 如 表 10. 1 所 示 。 
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表 10.1 学 生 选课 关系 


学 号 课程 名 称 所 属 专 业 
20180001 高 等 数学 信息 专业 
20180001 英语 信息 专业 
20180002 高 等 数学 信息 专业 
20180002 英语 信息 专业 
20180003 高 等 数学 信息 专业 
20180003 英语 信息 专业 
20180011 英语 人 文 专业 
20180011 文学 人 文 专业 
20180012 英语 人 文 专业 
20180012 文学 人 文 专业 
20180013 英语 人 文 专业 
20180013 文学 人 文 专业 


3) 关系 的 性 质 

(1) 关系 可 以 是 空 关系 ( 即 一 个 关系 可 以 不 包含 任何 元 组 )。 如 在 初始 时 ,只 创建 关 
系 的 框架 (结构 ) 即 是 如 此 。 

(2) 关系 中 的 列 为 属性 ,NN 度 关系 必用 个 属性 ,属性 必须 命名 。 

(3) 不 同 的 属性 可 以 来 自 同一 个 域 ;同一 列 中 的 分 量 只 能 来 自 同 一 个 域 ,是 同类 型 的 
数据 。 

(4) 列 的 次 序 无 关 紧 要 ,可 以 任意 交换 。 

(5) 关系 中 的 元 组 顺序 无 关 紧要 ,但 在 同一 个 关系 中 不 能 有 相同 的 元 组 。 

(6) 关系 中 的 每 个 属性 必须 是 原子 的 ,是 不 可 分 的 数据 项 (属性 ) 。 

(7) 由 于 在 对 关系 数据 库 操作 时 ,随时 都 可 能 做 修改 性 操作 ,如 插入 、 删 除 和 更 新 等 ， 
会 使 关系 发 生变 化 。 

(8) 判断 两 个 关系 是 否 相 等 ,与 属性 次 序 无 关 , 与 关系 的 命名 也 无 关 。 如 果 两 个 关系 
的 差别 只 是 关系 名 不 同 ,属性 次 序 不 同 或 元 组 次 序 不 同 ,那么 这 两 个 关系 相等 。 


2. 关系 完整 性 约束 


关系 的 完整 性 约束 条 件 包括 实 体 完 整 性 ,参照 完整 性 和 用 户 定义 的 完整 性 三 类 。 

(1) 实体 完整 性 规则 : 关系 中 每 一 个 元 组 中 的 主键 不 能 为 空 且 取 值 必须 唯一 。 例 如 
以 下 两 个 关系 中 ,学 生 关系 的 关键 字 是 “学 号 ”, 其 值 必须 唯一 旦 不 能 包含 空 数据 ,否则 就 
不 能 唯一 地 标识 一 个 学 生 了 。 因 此 ,该 表 满 足 实体 完整 性 规则 。 例 如 : 

学 生 信息 表 ( 学 号 ,姓名 ,性 别 , 出 生年 月 ,籍贯 ,民族 ,身份 证 号 ,班级 编号 ) 

班级 信息 表 ( 班 级 编号 ,班级 名 称 ,所 属 学 院 ,班级 人 数 ) 


124 


关系 模型 与 关系 代数 


实体 完整 性 的 作用 是 : 一 旦 定义 表 的 主键 ,DBMS 将 自动 地 对 该 表 中 的 每 一 行 的 主 
键 值 进行 检查 , 若 发 现 主键 值 为 空 或 不 唯一 ,DBMS 会 给 出 错误 信息 ,这 样 就 能 确保 表 中 
的 每 一 行 是 唯一 的 .可 以 区 分 的 。 

(2) 参照 完整 性 规则 : 在 关系 数据 库 中 ,关系 与 关系 之 间 是 通过 公共 属性 相 联系 的 ,这 
个 公共 属性 是 一 个 关系 的 关键 字 和 另 一 个 关系 的 非 关键 字 属 性 ( 称 为 外 部 关键 字 , 简 称 外 
键 )。 一 个 关系 中 的 外 键 的 取 值 或 者 为 空 ,或 者 取 参 照 关系 中 的 某 个 关键 字 值 。 例 如 上 述 两 
个 关系 中 ,学 生 关 系 和 班级 关系 之 间 的 联系 是 通过 班级 编号 实现 的 ,班级 编号 是 班级 信息 表 
的 关键 字 , 是 学 生 信息 表 的 外 键 。 因 而 ,班级 编号 的 取 值 必须 符合 实体 完整 性 规则 。 而 在 学 
生 信息 表 中 ,班级 编号 的 取 值 或 者 为 空 ,或 者 等 于 班级 信息 表 中 某 个 关键 字 值 。 

在 删除 和 修改 参照 关系 时 ,会 破坏 参照 完整 性 。 例 如 ,在 删除 班级 信息 表 中 的 一 条 记 
录 时 ,会 引起 学 生 信息 表 中 取 值 错误 。 为 了 避免 这 种 情况 发 生 , 可 以 在 DBMS 中 通过 适 
当 的 设置 ,由 DBMS 保证 参照 完整 性 。 

在 删除 参照 关系 中 的 记录 时 ,可 以 采取 以 下 措施 。 

@ 受 限 删除 。 禁 止 删除 , 即 如 果 删 除 参照 关系 中 的 元 组 会 破坏 参照 完整 性 规则 , 则 
不 允许 删除 。 例 如 ,删除 班级 信息 表 中 的 “计算 机 1801 班 ”, 将 破坏 完整 性 规则 ,因此 不 允 
许 删 除 。 

@ 级 联 删 除 。 如 果 要 删除 参照 关系 中 的 元 组 , 则 同时 将 依赖 该 关系 的 表 中 对 应 的 元 
组 都 全 部 删除 。 例 如 ,删除 班级 信息 表 中 的 “计算 机 1801 班 ”, 则 同时 将 学 生 信 息 表 中 对 
应 的 所 属 该 班级 的 学 生 全 部 都 删除 ,以 保证 参照 完整 性 。 

@ 置 空 值 删除 。 在 删除 参照 关系 中 的 元 组 时 ,同时 将 依赖 该 关系 的 表 中 的 外 键 置 为 
空 值 。 
对 于 修改 参照 关系 中 记录 的 关键 字 时 ,也 可 以 采取 受 限 修改 .级 联 修改 和 置 空 修改 的 
方法 来 保证 参照 完整 性 。 

参照 完整 性 的 作用 是 : 在 关系 数据 库 系 统 中 ,一 旦 定义 了 表 的 外 键 , 也 即 定义 了 外 键 
与 另 一 个 表 的 主键 的 参照 与 被 参照 联系 ,DBMS 将 根据 外 键 的 定义 ,自动 检查 表 中 的 每 
一 行 , 若 发 现 外 键 值 违反 外 键 的 规则 ,DBMS 会 给 出 出 错 信息 ,要 求 用 户 纠正 ,这 样 能 确 
保 表 之 间 的 参照 与 被 参照 联系 的 正确 性 。 

(3) 用 户 定义 的 完整 性 规则 : 用 户 定 义 的 完整 性 规则 是 针对 某 一 具体 数据 的 约束 条 
件 , 根 据 具体 的 应 用 需求 来 确定 的 , 它 反映 某 一 具体 应 用 所 涉及 的 数据 必须 满足 的 语义 要 
求 。 系 统 应 提供 定义 和 检验 这 类 完整 性 的 机 制 ,以 便 用 统一 的 系统 方法 来 处 理 它们 ,不 再 
由 应 用 程序 承担 这 项 工作 。 

例如 ,学 生成 绩 应 大 于 等 于 零 , 学 生性 别 的 取 值 范围 只 能 是 “ 男 / 女 ”, 教 师 教龄 不 能 大 
于 年 龄 等 。 


3. 关系 操作 


现实 世界 随 着 时 间 在 不 断 变化 ,因而 在 不 同 的 时 刻 ,数据 库 世 界 中 关系 模式 的 关系 实 
例 也 会 有 所 变化 ,以 反映 现实 世界 的 变化 。 关 系 实例 的 这 种 变化 是 通过 关系 操作 来 实 
现 的 。 
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关系 模型 中 的 关系 操作 有 查询 操作 和 更 新 操作 (包括 插入 、 删 除 和 修改 ) 两 大 类 。 关 
系 模 型 的 查询 表达 能 力 很 强 ,因此 查询 操作 是 关系 操作 中 最 主要 的 部 分 。 查 询 操作 又 可 
以 分 为 选择 (Select)、 投影 (Project)、 连 接 (Join)、 除 (Divide)、 并 (Union)、 交 
(Intersection) 、 差 (Except) ` 笛 卡 儿 积 等 。 其 中 ,选择 、 投 影 、 集 合并 、 集 合 差 和 笛 卡 儿 积 
是 5 种 基本 关系 操作 ,其 他 操作 都 可 以 通过 基本 操作 来 定义 和 导出 。 


10.2 关系 代数 


在 关系 代数 中 , 把 关系 看 成 是 元 组 的 集合 。 因 此 ,集合 中 的 定义 与 运算 均 适 用 于 
关系 代数 中 常用 以 下 运算 符 。 

合 运算 符 : U (并 ) ,一 ( 差 ), 门 ( 交 ),X( 笛 卡 儿 积 )。 

关系 运算 符 : 开 ( 投 影 ) ,a( 选 择 ) ,pa( 连 接 ) ,二 ( 除 ) 。 

算术 比较 运算 符 : 二 (大 于 ), 宇 (大 于 或 等 于 ) ,二 (小 于 ) ,三 (小 于 或 等 于 ) ,了 (不 等 于 )。 
逻辑 运算 符 : 一 ( 非 ), 人 (与),V (或 )。 


10.2.1 集合 的 三 种 基本 运算 一 一 交 、 并 、 差 


这 三 种 运算 用 于 关系 时 ,要 求 参与 运算 的 两 个 关系 的 度数 相同 , 即 包含 相同 个 数 的 属 
性 。 此 外 ,要 求 相应 属性 值 处 于 同一 个 域 , 即 要 求 两 个 关系 是 相 容 的 。 设 有 关系 尺 和 5S， 
有 下 面 三 种 运算 。 


1. 并 


关系 RR 与 S 的 并 记 为 RUS, 并 运算 实际 上 是 把 两 个 关系 的 所 有 元 组 合并 在 一 起 , 删 
去 重复 元 组 所 得 到 的 集合 ,如 图 10. 1 所 示 。 


2. 浆 


关系 及 与 S 的 差 记 作 R 一 S$。 它 是 由 属于 R 而 不 属于 S 的 所 有 元 组 组 成 的 集合 ,如 
图 10.2 所 示 。 


3. 交 


关系 尺 与 S 的 交 记 作 RNS。 它 是 由 同时 属于 R 和 S 的 元 组 组 成 的 集合 ,如 图 10. 3 
所 示 。 


ABE. 


图 10.1 RUS 图 10.2 R 一 S 图 10.3 RNS 
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【 例 10.4】 有 关系 A 和 B 分 别 如 表 10.2 所 示 。 
表 10.2 关系 A 和 B 


(a) 关系 A 
学 号 课程 名 称 所 属 专业 
20180001 高 等 数学 信息 专业 
20180001 英语 信息 专业 
20180001 C 语 言 信息 专业 
20180001 数据 库 原理 信息 专业 
20180002 高 等 数学 信息 专业 
20180002 英语 信息 专业 
(b) 关系 B 
学 号 课程 名 称 所 属 专 业 
20180011 英语 人 文 专业 
20180011 文学 人 文 专业 
20180011 计算 机 基础 人 文 专业 
20180011 管理 学 人 文 专业 
20180012 英语 人 文 专业 
20180012 文学 人 文 专业 
(c) 关系 AUB 
学 号 课程 名 称 所 属 专 业 
20180001 高 等 数学 信息 专业 
20180001 英语 信息 专业 
20180001 C 语 言 信息 专业 
20180001 数据 库 原理 信息 专业 
20180002 高 等 数学 信息 专业 
20180002 英语 信息 专业 
20180011 英语 人 文 专业 
20180011 文学 人 文 专业 
20180011 计算 机 基础 人 文 专业 
20180011 管理 学 人 文 专业 
20180012 英语 人 文 专业 
20180012 文学 人 文 专业 


含义 : 信息 专业 和 人 文 专业 学 生 的 选课 情况 。 


127 


数据 结构 与 数据 库 应 用 教程 


【 例 10.5】 有 关系 C 和 分 别 如 表 10. 3 所 示 。 
表 10.3 关系 C 和 D 


(a) 关系 C 
学 号 课程 名 称 学 号 课程 名 称 
20180001 高 等 数学 20180001 数据 库 原理 
20180001 英语 20180002 高 等 数学 
20180001 C 语 言 20180002 英语 
(b) 关系 DD 
学 号 课程 名 称 学 号 课程 名 称 
20180001 英语 20180001 管理 学 
20180001 文学 20180002 英语 
20180001 计算 机 基础 20180002 文学 
(c) 关系 CUD 
学 号 课程 名 称 学 号 课程 名 称 
20180001 高 等 数学 20180002 英语 
20180001 英语 20180001 文学 
20180001 C 语言 20180001 计算 机 基础 
20180001 数据 库 原理 20180001 管理 学 
20180002 高 等 数学 20180002 文学 
含义 : 学 生 在 C 和 中 共 选 修了 哪些 课程 。 
(d) 关系 CND 
学 号 课程 名 称 学 号 课程 名 称 
20180001 英语 20180002 英语 


含义 : 学 生 在 C 和 DD 中 进行 选课 ,学 生 在 两 处 同时 选修 了 哪些 课程 。 


(e) 关系 CD 
学 号 课程 名 称 学 号 课程 名 称 
20180001 高 等 数学 20180001 数据 库 原理 
20180001 C 语言 20180002 高 等 数学 


含义 : 学 生 在 C 和 DD 中 进行 选课 ,学 生 仅 在 C 中 选 的 课程 。 
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10.2.2 关系 的 基本 运算 


专门 的 关系 运算 有 : 开 ( 投 影 ) ,c( 选 择 ) ,2a( 连 接 ) ,二 ( 除 )。 有 些 查 询 需 要 几 个 基本 
运算 的 组 合 ,要 经 过 若干 步骤 才能 完成 。 


1. 投影 运算 (1 ) 一 一 Project 


投影 运算 也 是 对 单个 关系 施加 的 运算 , 它 是 一 种 垂直 方向 ( 即 列 的 方向 ) 上 的 运算 。 
其 基本 思想 是 : 从 一 个 关系 中 选择 所 需要 的 属性 ,并 重新 排列 组 成 一 个 新 的 关系 。 因 投 
影 后 属性 个 数 要 减少 , 故 形成 新 的 关系 。 因 此 ,应 重新 给 这 个 关系 命名 。 

设 尺 是 上 度 关系 ,Ana,Az,…,Az 分 别 是 它 的 第 i1,i2,…, 丰 个 属性 , 即 : R(An， 
Az，…,Ax), 则 关系 尺 在 A ,Ais，,…,Aa 上 的 投影 是 一 个 m 度 关系 , 记 作 

IAa,Az,*,An(R) (mSk) 

【 例 10.6】 从 Students 表 ( 如 表 10.4 所 示 ) 中 选择 sno、sname 两 个 列 组 成 新 表 的 

投影 。 


表 10.4 Students( 学 生 ) 


sno sname SSeX Sage sclass 
J20001 李 楷 M 19 JS2001 
J20002 会 F 20 JS2001 
J20003 王者 M 20 JS2001 
D20001 赵 良 M 18 DZ2001 
运算 可 写成 : 


I vo,snome (Students) 
对 表 10. 4 操作 的 结果 如 表 10.5 所 示 。 
表 10.5 投影 运算 的 结果 


SnO sname sno sname 
J20001 李 楷 J20003 玉 者 
J20002 张 会 D20004 赵 良 


2. 选择 运算 (6) 一 一 Select 


选择 运算 是 对 单个 关系 施加 的 运算 , 它 是 一 种 水 平方 向 上 的 选择 ,其 目的 是 在 关系 R 
上 ,把 满足 条 件 的 元 组 抽出 来 构成 新 的 关系 ,这 个 关系 是 原 关 系 R 上 的 一 个 子 集 。 
设 下 是 一 个 条 件 , 则 在 关系 R 上 的 下 选择 运算 记 作 or(R), 且 
oF (R) 二 {1E RI 满足 FF} 
式 中 ,t 为 元 组 ;下 为 形 如 a08 的 表达 式 ;a 和 有 是 属性 名 或 常数 ,但 不 能 同时 为 常数 ;0 是 算 
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术 比 较 运算 符 ( 二 (大 于 ), 宇 (大 于 或 等 于 ) ,二 (小 于 ) ,过 (小 于 或 等 于 ), 关 (不 等 于 ))。 下 
的 计算 结果 为 逻辑 值 * 真 ”或 “ 假 ”。 
【 例 10.7】 从 Students 表 ( 如 表 10.4 所 示 ) 中 找 出 所 有 男 同学 的 情况 。 
选择 运算 可 以 写成 : 


0 ssex=Mm (Students) 
对 表 10. 4 操作 的 结果 如 表 10.6 所 示 。 
表 10.6 选择 运算 的 结果 


sno sname ssex sage sclass 
J20001 李 楷 | M | 19 JS2001 
J20003 王者 | M | 20 JS2001 
D20001 赵 良 M 18 DZ2001 


3. 连接 运算 (cq) 一 一 Join 

连接 运算 分 为 条 件 连接 运算 和 自然 连接 运算 。 

1) 条 件 连接 运算 

按照 给 定 的 条 件 ,把 两 个 关系 中 一 切 可 能 的 组 合 方式 拼接 起 来 形成 一 个 新 的 关系 , 称 
为 条 件 连接 运算 。 

实际 上 ,连接 运算 就 是 在 两 个 关系 的 笛 卡 儿 积 上 进行 选择 运算 。 

设 A 是 关系 R 中 的 属性 ,B 是 关系 S 中 的 属性 ,9€ {二 ,三 ,二 ,三 ,去 ) ,关系 RR 和 5S 
在 条 件 A0B 下 的 条 件 连接 记 作 

R paS 


AbB 
且 R SS 一 own(RXS) 
【 例 10.8】 Students 表 (如 表 10.4 所 示 ) 和 Class 表 ( 如 表 10.7 所 示 ) 的 等 值 连接 可 写成 : 


GStudents. slas=clas sclass (Students X Class) 


表 10.7 Class( 班 级 ) 


sclass number address 
JS2001 30 8201 
JS2002 31 8202 
DZ2001 32 6201 
等 值 连接 操作 的 结果 如 表 10. 8 所 示 。 
表 10.8 等 值 连接 运算 结果 
sno sname ssex sage sclass sclass number address 
J20001 李 楷 M 19 JS2001 JS2001 30 8201 


130 


关系 模型 与 关系 代数 


续 表 

sno sname Ssex sage sclass sclass number address 
J20002 张 会 F 20 JS2001 JS2001 30 8201 
J20003 王者 M 20 JS2001 JS2001 30 8201 
D20001 赵 良 M 18 DZ2001 DZ2001 32 6201 


2) 自然 连接 运算 

当 两 个 关系 RR 和 S 具有 公共 的 属性 名 时 ,从 关系 RR 和 S 的 第 卡 儿 积 中 筛选 出 其 公共 
属性 相等 的 那些 元 组 称 为 自然 连接 。 

自然 连接 和 条 件 连接 的 区 别 是 : 自然 连接 可 以 自动 地 删除 掉 重复 的 属性 名 ,而 只 保 
留 一 个 公共 属性 名 。 

自然 连接 运算 的 过 程 如 下 。 

(1) 计算 RXS; 

(2) 选择 同时 出 现在 RR 与 S 中 属性 相等 的 元 组 ; 

(3) 去 掉 重复 属性 。 

【 例 10.9】 Students 表 ( 如 表 10.4 所 示 ) 和 Class 表 ( 如 表 10.7 所 示 ) 的 自然 连接 可 
写成 : 

Students DAClass 
自然 连接 运算 的 结果 如 表 10. 9 所 示 。 


表 10.9 自然 连接 运算 结果 


sno sname Ssex sage sclass number address 
J20001 李 楷 M 19 JS2001 30 8201 
J20002 张 会 F 20 JS2001 30 8201 
J20003 王者 M 20 JS2001 30 8201 
D20001 赵 良 M 18 DZ2001 32 6201 


任何 一 种 关系 数据 库 系 统 都 能 完成 投影 .选择 和 连接 这 三 种 关系 操作 ,有 了 这 三 种 数 
据 操作 功能 ,使 得 关系 数据 库 的 操作 十 分 灵活 。 


4. 除 运算 (二 ) 


Division 


除 运算 也 是 两 个 关系 之 间 的 运算 。 设 有 关系 R 和 S,R 能 被 S 除 的 条 件 有 两 个 : 一 
是 RR 中 的 属性 包含 S 中 的 属性 ,二 是 R 中 的 有 些 属性 不 出 现在 S 中 。R 除 以 S 表示 为 
RS, 设 商 为 了 ,T=R=S,T 的 属性 由 尺 中 那些 不 出 现在 S 中 的 属性 组 成 ,其 元 组 则 是 
S 中 所 有 元 组 在 R 中 对 应 值 相同 的 那些 元 组 值 。 

【 例 10.10】 给 出 选课 .选修 课 和 必修 课 三 个 关系 ,如 表 10. 10 所 示 , 它 们 的 关系 模式 为 : 

必修 课 ( 课 号 ,课程 名 称 ) 

选修 课 ( 课 号 ,课程 名 称 ) 
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选课 (学 号 , 课 号 ,成 绩 ) 
表 10.10 选课 .选修 课 和 必修 课 三 个 关系 表 
(a) 必修 课 (b) 选修 课 
课 号 课程 名 称 课 号 课程 名 称 
Cl C 语 言 程序 设计 C2 软件 工程 
C3 数据 库 原理 及 应 用 
(c) 选课 
学 号 课 号 成 ” 绩 学 号 课 号 成 ” 绩 
Sl Ct A S3 C3 B 
Sl C2 B S4 ci A 
Sl C3 B S4 C2 A 
S2 人 A ss C2 B 
S2 C3 B S5 G3 B 
S3 oi B S5 ci A 
(d) 选课 二 必修 课 
学 号 成 ” 绩 
S3 B 


含义 : 表示 选择 必修 课表 中 给 定 的 全 部 课程 C1 和 C3, 且 成 绩 一 样 的 学 生 的 学 号 和 成 绩 。 
(e) 1zg.ms (选课 )- 必修 课 
学 号 
Sl 


S2 


S3 


S5 


含义 : 表示 求 “学 过 必修 课 中 规定 的 全 部 课程 的 学 生 学 号 ”的 查询 要 求 , 应 先 对 被 除 关系 (选课 ) 投 
影 , 去 掉 不 需要 的 属性 (成 绩 ) ,再 做 除法 操作 。 
(1) 选课 = 选修 课 
学 号 成 ” 绩 学 号 成 ” 绩 
Sl B S5 B 


S4 A 


含义 : 表示 选择 选修 课表 中 给 定 的 全 部 课程 (本 例 中 只 有 C2 一 门 课 ), 且 成 绩 一 样 的 学 生 的 学 号 
和 成 绩 。 
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【 例 10. 11】 关系 代数 综合 应 
as nena 
学 生 ( 学 号 ,姓名 ,性 别 , 出 生年 月 ,所 在 班级 ) 
课程 (课程 号 ,课程 名 称 ,学 时 ,学 分 ,先行 课 ) 
选课 (学 号 ,课程 号 ,成 绩 ) 
(1) 选修 了 课程 号 为 “C1” 的 课程 的 学 生 学 号 , 即 
#8 (omas-cr( 选 课 ) ) 
说 明 : 当 需 要 投影 和 选择 时 ,应 先 选择 后 投影 。 
(2) 求 选修 了 课程 号 为 “C3” 的 课程 的 学 生 学 号 和 姓名 , 即 
] 末 #9, 名 (0 课 女 =ca'( 选 课 P<I 学 生 ) ) 
说 明 : 通过 选课 表 与 学 生 表 的 自然 连接 ,得 出 选课 表 中 学 号 对 应 的 姓名 和 其 他 学 生 
信息 。 本 题 也 可 以 按 先 求 选择 再 连接 的 顺序 操作 。 
(3) 求 没 有 选修 课程 号 为 “C2” 的 课程 的 学 生 学 号 , 即 
JT%s (学 生 ) 一 [8s (ows-cz( 选 课 ) ) 
说 明 : 在 全 部 学 号 中 去 掉 选 修 课 程 号 为 “C2” 的 课程 的 学 生 学 号 ,就 得 出 没有 选修 课 
程 号 为 “C2” 的 课程 的 学 生 学 号 。 由 于 在 并 、 交 、 差 运算 时 ,参加 运算 的 关系 结构 应 一 致 ， 
故 应 先 投影 ,再 执行 差 运算 。 
(4) 求 选修 了 课程 号 为 “C1” 或 “C2” 的 课程 的 学 生 学 号 , 即 
| 


开交 号 (ops-cih 课 性 9-cx( 选 课 ) ) 
小 结 


本 章 主要 介绍 了 关系 的 定义 和 性 质 , 关 系数 据 库 管理 系统 中 应 用 到 的 关系 代数 的 基 
本 知识 。 

(1) 给 定 一 组 域 Di ,D;,D;,… ,Dyw, 则 D; XD;XDsX.…XDyn={(di,dz,ds,*…,d,) 
| di;ED;, i 二 1,2,…,n} 称 为 D1,D;,D;,… ,Dw 的 笛 卡 儿 积 。 

(2) 给 定 一 组 域 D, ,D;,D;,… ,Dy, 则 Di XD: XD;X… XDw 的 子 集 称 为 D1 Xx D; 
XD;X…xXDx 上 的 关系 , 记 作 RR(Di,D;,D;,…,Dy), 式 中 ,R 称 为 关系 名 ,N 称 为 关系 
R 的 度数 。 

(3) 关系 的 完整 性 约束 条 件 包 括 实体 完整 性 ,参照 完整 性 和 用 户 定义 的 完整 性 三 类 ，。 

(4) 关系 代数 中 常用 的 集合 运算 符 有 : U (并 ) ,一 ( 差 ), 门 ( 交 ),X( 笛 卡 儿 积 )。 

(5) 关系 代数 中 常用 的 关系 运算 符 有 : 开 ( 投 影 ) ,a( 选 择 ) ,qd( 连 接 ) ,二 ( 除 ) 。 

(6) 投影 运算 是 对 单个 关系 施加 的 运算 , 它 是 一 种 垂直 方向 ( 即 列 的 方向 ) 上 的 运算 。 
其 基本 思想 是 : 从 一 个 关系 中 选择 所 需要 的 属性 ,并 重新 排列 组 成 一 个 新 的 关系 。 

(7) 选择 运算 也 是 对 单个 关系 施加 的 运算 , 它 是 一 种 水 平方 向 上 的 选择 ,其 目的 是 在 
关系 尺 上 ,把 满足 条 件 的 元 组 抽出 来 构成 新 的 关系 ,这 个 关系 是 原 关系 R 上 的 一 个 子 集 。 
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(8) 连接 运算 分 为 条 件 连接 运算 和 自然 连接 运算 。 自 然 连接 和 条 件 连接 的 区 别 是 : 
自然 连接 可 以 自动 地 删除 掉 重 复 的 属性 名 ,而 只 保留 一 个 公共 属性 名 。 

(9) 除 运算 也 是 两 个 关系 之 间 的 运算 。 设 有 关系 RR 和 5S,R 能 被 S 除 的 条 件 有 两 个 : 
一 是 尺 中 的 属性 包含 S 中 的 属性 ,二 是 R 中 的 有 些 属性 不 出 现在 S 中 。R 除 以 S 表示 为 
R 二 5S, 设 商 为 T,T 二 RS,T 的 属性 由 R 中 那些 不 出 现在 S 中 的 属性 组 成 ,其 元 组 则 
是 S 中 所 有 元 组 在 R 中 对 应 值 相同 的 那些 元 组 值 。 

本 章 是 非常 重要 的 一 章 , 为 后 续 章 节 介绍 SQL 查询 语句 打下 理论 基础 。 


习题 


设 有 如 下 关系 模型 : 

学 生 信息 表 S(SNO,SNAME,SEX,AGE) 
教师 授课 表 T(CNO,CNAME,TEACHER) 
学 生 选 课表 ST(SNO,CNO,SCORE) 

请 用 关系 表达 式 表示 下 列 查询 语句 。 


1 
2 
3 
4 
10.5 
6 
8 


10.9 


查询 “ 降 老 师 ” 所 授课 程 的 课程 号 (CNO) 和 课程 名 (CNAME) 。 
查询 年 龄 大 于 20 岁 的 男生 学 号 (SNO) 和 姓名 (SNAME)。 

查询 选修 “ 隋 老 师 ” 所 授 全 部 课程 的 学 生 姓 名 (SNAME) 。 

查询 “ 吴 梅 "同学 没有 选修 的 课程 的 课程 号 (CNO)。 

查询 全 部 学 生 都 选修 的 课程 的 课程 号 (CNO) 和 课程 名 (CNAME) 。 
查询 选修 课程 包含 “ 隋 老 师 ” 所 授课 程 之 一 的 学 生 学 号 (SNO) 。 
查询 选修 了 “C 语言 ”的 学 生 学 号 (SNO) 。 

查询 选修 了 全 部 课程 的 学 生 姓名 (SNAME)。 

查询 选修 张 岳 同 学 所 修 课 程 的 学 生 学 号 (SNO) 和 姓名 (SNAME)。 


第 11 章 关系 数据 库 标 准 语言 一 一 SQL 


本 章 学 习 目 标 
。 理解 SQL 概述 及 特点 ,SQL 的 数据 定义 ,嵌入 式 SQL 的 使 用 方法 。 
。 掌握 数据 查询 .数据 操纵 .视图 、 数 据 控制 的 SQL。 


SQL 是 Structured Query Language( 结 构 化 查询 语言 ) 的 缩写 ,是 关系 数据 库 的 标准 
语言 ,其 功能 不 仅 限于 查询 ,而 且 非 常 全 面 强 大 ,易学 易 用 ,所 以 几乎 现在 市 面 上 的 所 有 数 
据 库 管理 系统 都 支持 SQL ,使 之 成 为 数据 库 领 域 中 的 主流 语言 。 


11.1 SQL 概述 及 特点 


11.1.1 SQL 概述 


SQL 于 1974 年 由 Boyce 和 Chamberlin 提出 ,并 在 IBM 公司 研制 的 关系 数据 库 管 理 
系统 System R 上 得 以 实现 , 它 功 能 丰富 ,语言 简练 ,易学 易 用 ,赢得 了 众多 用 户 ,被 许多 
数据 库 厂商 所 采用 ,之 后 又 由 各 厂商 进行 了 不 断 的 修改 ,完善 ,目前 已 成 为 关系 数据 库 的 
标准 操纵 语言 。 

1986 年 10 月 ,美国 国家 标准 局 的 数据 库 委 员 会 X3H2 批准 了 SQL 作为 关系 数据 库 
语言 的 美国 标准 , 且 公 布 了 SQL 标准 文本 (SQL-86) 。1987 年 ,国际 标准 化 组 织 也 采纳 了 
这 个 标准 。 此 后 SQL 标准 不 断 得 到 修改 和 完善 ,美国 国家 标准 局 又 于 1989 年 公布 了 
SQL-89 标准 ,1992 年 公布 了 SQL-92 标准 ,1999 年 公布 了 SQL-99 标准 。 还 有 一 些 对 
SQL-99 的 扩展 ,统称 为 SQL: 2003。 另 外 ,各 大 数据 库 厂商 也 都 根据 自己 产品 的 特点 提 
供 了 不 同 版 本 的 SQL。 这 些 版 本 的 SQL 都 包括 最 初 的 标准 功能 ,还 在 很 大 程度 上 支持 
SQL-92。 事 实 上 ,目前 还 没有 一 个 数据 库 产品 完全 支持 SQL-92, 而 是 支持 SQL-92 的 
“ 子 集 的 超 集 ”, 即 大 部 分 的 产品 在 SQL-92 主要 功能 的 基础 之 上 各 自 做 了 修改 和 扩展 ,有 
的 还 部 分 地 支持 SQL-99 和 SQL: 2003。 本 书 对 SQL 的 讨论 主要 以 SQL-92 为 基础 。 

SQL 由 4 部 分 组 成 ,包括 数据 定义 语言 (DDL) ,数据 操纵 语言 (DML) ,数据 控制 语言 
(DCL) 和 其 他 ,其 功能 如 下 。 

(1) 数据 定义 语言 (Data Definition Language,DDL) : 主要 用 于 定义 数据 库 的 逻辑 结 
构 , 包 括 数据 库 .基本 表 、 视 图 和 索引 等 ,扩展 DDL 还 支持 存储 过 程 函数、 对 象 . 触 发 器 等 
的 定义 。DDL 包括 三 类 语言 , 即 定义 、 修 改 和 删除 。 

(2) 数据 操纵 语言 (Data Manipulation Language,DML) : 主要 用 于 对 数据 库 的 数据 
进行 检索 和 更 新 ,其 中 ,更 新 操作 包括 插入 、 删 除 和 修改 数据 。 
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(3) 数据 控制 语言 (Data Control Language,DCL): 主要 用 于 对 数据 库 的 对 象 进行 授 
权 、 用 户 维护 (包括 创建 ,修改 和 删除 )、 完 整 性 规则 定义 和 事务 定义 等 。 

(4) 其 他 : 主要 是 嵌入 式 SQL 和 动态 SQL 的 定义 ,规定 了 SQL 在 宿主 语言 中 使 用 
的 规则 。 扩 展 SQL 还 包括 数据 库 数据 的 重新 组 织 、 备 份 与 恢复 等 功能 。 


11.1.2 SQL 的 特点 


SQL 因 其 简单 .灵活 、 易 掌握 ,受到 了 广大 用 户 的 欢迎 。SQL 既 可 以 作为 交互 式 数据 
库 语言 使 用 ,也 可 以 作为 程序 设计 语言 的 子 语言 使 用 , 它 是 一 个 兼 有 关系 代数 和 元 组 演算 
特征 的 语言 ,其 特点 如 下 所 述 。 


1. 数据 描述 、 操 纵 、 控 制 功能 的 一 体 化 


SQL 集 数 据 定 义 语言 .数据 操纵 语言 .数据 控制 语言 的 功能 于 一 体 , 语 言 风 格 统一 ， 
可 以 独立 完成 数据 库 生 命 周 期 中 的 全 部 活动 ,包括 定义 关系 模式 、 建 立 数据 库 、 择 入 数据 、 
对 数据 库 中 的 数据 进行 查询 和 更 新 、 重 构 和 维护 数据 库 .数据库 安全 性 和 完整 性 控制 等 一 
系列 操作 要 求 , 这 就 为 数据 库 应 用 系统 的 开发 提供 了 良好 的 环境 。 用 户 在 数据 库 系 统 投 
入 运行 后 ,还 可 根据 需要 随时 地 、 逐 步 地 修改 模式 , 且 不 影响 数据 库 的 运行 ,从 而 使 系统 具 
有 良好 的 可 扩展 性 。 


2. 高 度 非 过 程 化 


用 SQL 进行 数据 操作 ,用 户 只 需要 指出 “做 什么 ”, 而 不 需要 指出 “怎么 做 ”, 因 此 用 户 
无 须 了 解数 据 的 存放 位 置 和 存 取 路 径 ,数据 的 存 取 和 整个 SQL 语句 的 操作 过 程 由 系统 自 
动 完成 。 这 种 高 度 非 过 程 化 的 特性 大 大 减轻 了 用 户 负担 ,并 且 有 利于 提高 数据 独立 性 。 


3. 面向 集合 的 操作 方式 


SQL 采用 集合 操作 方式 ,不 仅 查 询 操作 的 对 象 是 元 组 的 集合 ,而 且 一 次 插入 、 删 除 和 
更 新 操作 的 对 象 也 可 以 是 元 组 的 集合 。 非 关系 数据 模型 采用 的 是 面向 记录 的 操作 方式 ， 
其 操作 对 象 是 一 条 记录 。 


4. 用 同一 种 语法 结构 提供 两 种 使 用 方式 


SQL 有 两 种 使 用 方式 。 一 种 是 联机 交互 使 用 的 方式 ,此 时 ,SQL 为 自主 式 语言 ,可 独 
立 使 用 ,这 种 方式 适用 非 计 算 机 专业 人 员 使 用 ; 另 一 种 是 嵌入 到 某 种 高 级 程序 设计 语言 的 
程序 中 ,来 实现 数据 库 操作 ,在 这 种 方式 下 ,SQL 为 嵌入 语言 , 它 依 附 于 主语 言 ,该 方式 适 
用 于 程序 员 。 这 两 种 使 用 方式 为 用 户 提供 了 灵活 选择 的 余地 ,提供 了 极 大 的 方便 。 尽 管 
使 用 方式 不 同 ,但 所 用 语言 的 语法 结构 基本 上 是 一 致 的 。 


5. 语言 简洁 、 易 学 易 用 
虽然 SQL 功能 强大 ,但 是 设计 巧妙 .语言 简洁 ,只 有 少量 的 关键 字 ,而 且 语法 简单 , 接 
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近 英 语 口语 ,学 习 起 来 非常 容易 。SQL 的 所 有 核心 功能 只 需要 9 个 动词 ,分别 如 下 。 
(1) 数据 查询 : SELECT。 
(2) 数据 定义 : CREATE,DROP,ALTER。 
(3) 数据 操纵 : INSERT,UPDATE,DELETE。 
(4) 数据 控制 : GRANT,REVOKE。 


11.1.3 SQL 的 基本 概念 


在 SQL-92 标准 中 使 用 了 一 些 与 传统 关系 模型 不 同 的 术语 ,这 些 术 语 在 数据 库 领 域 
使 用 的 频 度 甚至 超过 对 应 关系 模型 的 术语 ,因此 必须 加 以 介绍 。 

在 SQL 数据 库 中 ,与 关系 模型 中 关系 (Relation) 相 对 应 的 术语 是 表 (Table) 。 表 是 行 
(Row) 的 集合 。 行 是 值 (Value) 的 非 空 序列 。 行 与 表 具 有 相同 的 基数 ,其 值 的 数量 与 表 的 
列 (Column) 的 数量 相等 。 每 行 中 的 第 i 个 值 与 表 的 第 i 个 列 相对 应 。 行 是 对 表 执行 插入 
和 删除 操作 时 最 小 的 数据 单位 。 可 见 ,在 SQL 数据 库 中 ,与 元 组 相对 应 的 术语 是 行 ,与 属 
性 相对 应 的 术语 是 列 , 与 分 量 相 对 应 的 术语 是 值 。 

在 SQL 数据 库 中 关系 可 以 有 多 种 存在 形式 ,最 常见 的 有 以 下 三 种 。 

(1) 持久 存储 的 表 (Table) ,也 称 为 基 表 (Base Table)、 基 本 表 、 数 据 库 表 或 库 表 等 。 
数据 库 中 的 持久 数据 存储 在 基本 表 中 ,用 户 可 以 对 基本 表 中 的 行进 行 查询 和 更 新 。 

(2) 逻辑 表 , 称 为 视图 (View) ,是 通过 运算 定义 的 关系 。 这 种 关系 并 不 实际 存储 数 
据 , 它 只 是 在 需要 的 时 候 被 完整 或 部 分 地 生成 。 

(3) 临时 表 , 是 在 执行 数据 查询 和 更 新 等 操作 时 生成 的 临时 关系 ,用 于 存储 操作 的 中 
间 数 据 ,操作 结束 后 即 被 删除 。 

上 述 最 常用 的 是 基本 表 , 在 不 会 混淆 的 情况 下 ,就 简单 地 称 基 本 表 为 表 。 除 上 述 三 种 
表 之 外 ,有 些 关系 数据 库 系统 中 可 能 还 有 外 部 表 ( 数 据 存储 在 外 部 数据 文件 中 ) .索引 表 
(按照 结构 化 主键 排序 存储 数据 ) 等 形式 。 

SQL 支持 关系 数据 库 的 三 级 模式 结构 ,如 图 11. 1 所 示 。 


内 模式 | 存储 文件 1 | | 存储 文件 2 | 


图 11.1 SQL 支持 的 关系 数据 库 模 式 
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从 图 11.1 中 可 以 看 出 : 

(1) 外 模式 对 应 于 视图 和 部 分 基本 表 , 模 式 对 应 于 基本 表 , 内 模式 对 应 于 存储 文件 。 

(2) 用 户 可 以 用 SQL 对 视图 和 基本 表 进 行 查询 等 操作 。 在 用 户 眼 中 ,视图 和 基本 表 
都 是 一 样 的 ,都 是 关系 ,而 存储 文件 对 用 户 来 说 是 透明 的 。 

(3) 视图 是 从 一 个 或 几 个 基本 表 导 出 的 表 , 它 本 身 不 独立 存储 在 数据 库 中 。 也 就 是 
说 ,数据 库 中 只 有 视图 的 定义 ,不 存储 对 应 的 数据 ,这 些 数据 仍 存放 在 导出 视图 的 基本 表 
中 ,实际 上 ,视图 就 是 一 个 虚 表 。 

(4) 基本 表 是 本 身 独 立 存 在 的 表 。 每 个 表 对 应 一 个 存储 文件 ,一 个 表 可 以 带 若干 索 
引 。 索 引 存放 在 存储 文件 中 。 


11.2 SQL 的 数据 定义 


数据 库 中 的 关系 集合 必须 由 数据 定义 语言 来 定义 ,包括 : 数据 库 模 式 、 关 系 模式 ,每 
个 属性 的 值 域 .完整 性 约束 ,每 个 关系 的 索引 集合 和 关系 的 物理 存储 结构 等 。 

SQL 数据 定义 语言 的 功能 如 下 。 

(1) 数据 库 的 定义 ,修改 和 删除 ; 

(2) 基本 表 的 定义 、 修 改 和 删除 ; 

(3) 视图 的 定义 、 修 改 和 删除 ; 

(4) 索引 的 定义 、 修 改 和 删除 。 

这 些 对 象 的 定义 、 修 改 和 删除 方式 如 表 11. 1 所 示 。 


表 11.1 SQL 数据 定义 
操作 对 象 创 建 修改 删 。 除 
数据 库 CREATE DATABASE ALTER DATABASE DROP DATABASE 
基本 表 CREATE TABLE ALTER TABLE DROP TABLE 
视图 CREATE VIEW ALTER VIEW DROP VIEW 
索引 CREATE INDEX DROP INDEX 


11.2.1 数据 库 的 定义 

数据 库 作 为 一 个 整体 存放 在 外 存 的 物理 文件 中 。 物 理 文件 有 两 种 : 一 是 数据 文件 ， 
存放 数据 库 中 的 对 象 数据 ;二 是 日 志文 件 ,存放 用 于 恢复 数据 库 的 元 余数 据 。 

1. 数据 库 的 创建 


一 个 数据 库 创 建 在 物理 介质 (如 硬盘 ) 的 NTFS 分 区 或 者 FAT 分 区 的 一 个 或 多 个 文 
件 上 , 它 预先 分 配 了 将 要 被 数据 库 和 事务 日 志 所 使 用 的 物理 存储 空间 。 存 储 数据 的 文件 
叫 作 数 据 文件 ,存储 日 志 的 文件 叫 作 日 志文 件 ,这 些 文件 用 来 存储 数据 库 对 象 和 数据 。 在 
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创建 一 个 新 的 数据 库 的 时 候 , 仅 仅 是 创建 了 一 个 空 壳 ,必须 在 这 个 空 过 中 创建 对 象 ( 如 表 
等 ) ,然后 才能 使 用 这 个 数据 库 。 
定义 数据 库 操作 的 语法 为 : 


CREATE DATABASE <databaseName> 

[ON [<filespec >[,*…n]] 
[<filegroup >[ rn]]1] 

[LOG ON { <filespec >[,*…n]}] 


其 中 ， 
(1) = filespec > :: =[ PRIMARY J]([ NAME =<logicalFileName> ,] 
FILENAME 三 二 osFileName >'[,SIZE =<size> ] 
[,MAXSIZE ={ <maxSize>| UNLIMITED } ] 
[,FILEGROWTH =<growthIncrement> ] )[L,…n] 
(2) = filegroup >::= FILEGROUP <filegroupName> < filespec > [,**n] 
(3) 二 databaseName 记 : 被 创建 的 数据 库 的 名 字 , 满 足 要 求 : 长 度 可 以 为 1~~30, 第 
一 个 字符 必须 是 字母 或 下 画 线 或 字符 @ ;在 首 字 符 后 的 字符 可 以 是 字母 ,数字 或 者 前 面 规 
则 中 提 到 的 字符 ;名 称 中 不 能 有 空格 ;数据 库 的 大 小 可 以 被 扩展 或 者 收缩 。 
(4) ON: 指定 数据 库 中 数据 的 磁盘 文件 ,其 中 ,二 filespec 二 指数 据 文件 ,用 逗号 来 分 
隔 , 用 来 定义 主 逻辑 设备 中 的 数据 文件 。 除 了 主 逻 辑 设备 外 ,用 户 还 可 以 定义 用 户 的 逻辑 
设备 和 相关 用 户 文件 。 
(5) PRIMARY : 描述 在 主 逻 辑 设 备 中 定义 的 相关 文件 ,所 有 的 数据 库 系 统 表 存 放 在 
主 逻 辑 设备 中 ,同时 也 存放 没有 分 配 具体 逻辑 设备 的 对 象 。 在 主 逻 辑 设备 中 第 一 个 文件 
称 为 主 文 件 ,通常 包括 数据 库 的 逻辑 起 始 位 置 和 系统 表 。 
(6) LOG ON: 指定 数据 库 日 志 的 磁盘 文件 ,其 中 ,<filespec> 指 日 志文 件 。 如 果 没 
有 指定 LOG ON ,系统 将 自动 创建 单个 的 日 志文 件 。 
【 例 11. 1】 建立 学 生 数 据 库 StudentDB。 


CREATE DATABASE StudentDB 
ON 
(NAME= StudentDB, 
FILENAME ='E: \StudentDB.mdf ', 
SIZE =2MB, 
MAXSIZE =10MB, 
FILEGROWTH =1) 
LOG ON 
(NAME =StudentLog, 
FILENAME ='E: \StudentLog.1ldf', 
SIZE =1MB, 
MAXSIZE =5MB, 
FILEGROWTH =1); 


本 例 的 含义 是 : 在 磁盘 下 的 根 目录 下 ,创建 一 个 StudentDB 数据 库 , 只 有 一 个 主 逻 辑 
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设备 ,对 应 一 个 物理 文件 StudentDB. mdf, 该 文件 初始 大 小 为 2MB, 最 大 可 扩展 为 10MB; 
如 果 初 始 文件 装 不 下 数据 ,自动 按 1MB 进行 扩展 ,直到 10MB 为 止 。 日 志文 件 为 
StudentLog. ldf ,该 文件 初始 大 小 为 1MB, 最 大 可 扩展 为 5MB; 如 果 初 始 文件 装 不 下 数 
据 ,自动 按 1MB 进行 扩展 ,直到 5MB 为 止 。 


2. 数据 库 的 修改 


数据 库 在 运行 过 程 中 ,可 以 依据 数据 量 的 大 小 进行 修改 。 
修改 数据 库 操作 的 语法 为 : 


ALTER DATABASE <databaseName> 
{ ADD FILE <filespec >[,**“n ] [ TO FILEGROUP <filegroupName>] 
| ADD LOG FILE <filespec >[,*…n] 
| REMOVE FILE <logicalFileName> 
| ADD FILEGROUP <filegroupName> 
| REMOVE FILEGROUP <filegroupName> 
| MODIFY FILE <filespec> 
| MODIFY FILEGROUP <filegroupName><filegroupProperty> 
} 


其 中 : 

(1) 二 databaseName 二 : 指定 被 修改 的 数据 库 的 名 称 。 

(2) ADD FILE: 指定 添加 到 数据 库 中 的 数据 文件 。 

(3) TO FILEGROUP 二 filegroupName 过: 指定 文件 添加 到 的 文件 组 名 为 


< 一 filegroupName 二 的 文件 组 。 


件 。 


(4) ADD LOG FILE: 指定 添加 到 数据 库 中 的 日 志文 件 。 

(5) REMOVE FILE: 从 数据 库 系 统 表 中 删除 该 文件 ,并 物理 删除 该 文件 。 

(6) ADD FILEGROUP: 指定 要 添加 的 文件 组 。 

(7) <filegroupName> : 要 添加 或 除去 的 文件 组 名 称 。 

(8) REMOVE FILEGROUP: 从 数据 库 中 删除 文件 组 并 删除 该 文件 组 中 的 所 有 文 
只 有 在 文件 组 为 空 时 才能 删除 。 

(9) MODIFY FILE: 指定 要 更 改 给 定 的 文件 ,更 改选 项 包括 FILENAME 、SIZE、 


FILEGROWTH 和 MAXSIZE。 一 次 只 能 更 改 这 些 属性 中 的 一 种 。 必 须 在 一 filespec> 
中 指定 NAME ,以 标识 要 更 改 的 文件 。 如 果 指 定 了 SIZE ,那么 新 大 小 必须 比 文件 当前 大 
小 要 大 。 只 能 为 tempdb 数据 库 中 的 文件 指定 FILENAME, 而 且 新 名 称 只 有 在 
Microsoft SQL Server 重新 启动 后 才能 生效 。 
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【 例 11.2】 修改 MyDB 数据 库 。 


ALTER DATABASE MyDB 
MODIFY FILE (NAME=TempDev1, 
SIZE=20MB ); 


将 逻辑 文件 TempDevl 初始 大 小 修改 为 20MB。 
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3. 数据 库 的 删除 


删除 数据 库 时 ,系统 会 同时 从 系统 的 数据 字典 中 将 该 数据 库 的 描述 一 起 删除 ,有 的 数 
据 库 系统 还 会 自动 删除 与 数据 库 相 关联 的 物理 文件 。 
删除 数据 库 操作 的 语法 为 : 


DROP DATABASE <databaseName> 


11.2.2 基本 表 的 定义 


创建 了 数据 库 后 ,就 可 以 在 数据 库 中 建立 基本 表 。 通 过 将 基本 表 与 逻辑 设备 相关 联 ， 
使 得 一 个 基本 表 可 以 放 在 一 个 物理 文件 上 ,也 可 以 放 在 多 个 物理 文件 上 。 

SQL 支持 的 基本 数据 类 型 有 以 下 几 种 。 

(1) 整 型 : int(4B) ,smallint(2B) ,tinyint(1B) 。 

(2) 实 型 : float,real(4B) ,decimal(p,n),numericCp,n) 。 

(3) 字符 型 : char(n) ,varchar(Cn) ,text。 

(4) 逻辑 型 : bit, 只 能 取 0 和 1 ,不 允许 为 空 。 

(5) 货币 型 : money(8B,4 位 小 数 ) ,smallmoney(4B, 两 位 小 数 ) 。 

(6) 二 进 制 型 : binaryCn) ,varbinaryCn) ,image。 

(7) 时 间 型 : datetime(4B, 从 1753-01-01 开始 ) ,smalldatetime(4B, 从 1900-01-01 开始 ) 。 


1. 创建 基本 表 


基本 表 是 关系 模型 中 表示 实体 的 展现 方式 ,是 用 来 组 织 和 存储 数据 .具有 行列 结构 的 
数据 库 对 象 。 创 建 基本 表 的 语法 格式 为 : 


CREATE TABLE <tableName> 
(<columnNamel><dataType> [default <defaultValue>] [NULL/NOT NULL], 
<columnName2><dataType> [default <defaultValue>] [NULL/NOT NULL], 


[CONSTRAINT <constraintNamel>{ PRIMARY KEY | UNIQUE } 
(<columnName> [,<columnName>…] [ON <filegroupName>])], 

[CONSTRAINT <constraintName2>{ FOREIGN KEY } 
(<columnNamel> [,<columnName2>…])]， 

[REFERENCES [<dbName> .owner.]<refTable> 


(<refColumel> [,<refColume2>…])]，…) ON<filegroupName>) 


其 中 : 

(1) <tableName>: 新 表 的 名 称 。 表 名 必须 遵循 标识 符 规则 ,最 多 可 包含 128 个 字符 。 

(2) 二 columnName 记 : 表 中 列 的 名 称 。 列 名 必须 遵循 标识 符 命名 规则 并 且 在 表 中 
是 唯一 的 。 

(3) 二 dataType 祖 : 指定 列 的 数据 类 型 。 
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(4) default 二 defaultValue 放 : 为 列 设置 默认 值 , 属 于 可 选项 。 


(5) NULL/NOT NULL: 


(6) 二 constraintrName 记 : 定义 约束 的 名 字 , 属 于 可 选项 。 
(7) UNIQUE: 建立 唯一 索引 。 

(8) PRIMARY KEY: 建立 主 码 。 
(9) FOREIGN KEY: 建立 外 码 。 
(10) ON 过 filegroupName 记 : 将 对 象 放 在 指定 的 逻辑 设备 上 ,该 逻辑 设备 必须 是 在 
创建 数据 库 时 定义 的 , 缺 省 该 项 时 自动 将 对 象 建立 在 主 逻 辑 设 备 上 。 
下 面 通过 一 个 具体 的 实例 ,详细 讲解 SQL 创建 数据 库 表 的 基本 操作 。 创 建 学 生成 绩 
管理 数据 库 ScoreDB, 然 后 在 该 数据 库 中 创建 4 个 数据 表 :“ 班 级 信息 表 ”“ 学 生 信 息 表 ” 
“课程 信息 表 ” 和 “成 绩 信息 表 ”。 表 的 结构 及 数据 如 表 11.2 一 表 11. 9 所 示 。 


表 11.2 班级 信息 表 Class 


为 列 设置 是 否 人 允许 为 空 值 ,属于 可 选项 。 


班级 编号 班级 名 称 所 属 学 院 年 级 班级 人 数 
classNo className institute grade classNum 
char(6) varchar(30) varchar(30) smallint tinyint 

表 11.3 学 生 信息 表 Student 
学 号 姓名 性 别 出 生日 期 籍贯 民族 班级 编号 
sno sname SeX birthday native nation classNo 
char(9) varchar(20) char(2) datetime varchar(20) | varchar(30) char(6) 
表 11.4 课程 信息 表 Course 
课程 号 课程 名 称 学 分 学 时 先 修 课程 
cno cname creditHour courseHour priorCourse 
char(3) varchar(30) numeric tinyint char(3) 
表 11.5 成 绩 信息 表 Score 
学 号 课 程 号 成 绩 
sno cno score 
char(9) char(3) numeric 
表 11.6 班级 信息 表 Class 的 数据 
序号 classNo className institute grade classNum 
1 | CS1701 | 计算 机 科学 与 技术 17_01 班 信息 管理 学 院 2017 NULL 
2 | CS1801 计算 机 科学 与 技术 18_01 班 信息 管理 学 院 2018 NULL 
3 | ER1701 金融 管理 17_01 班 金融 学 院 2017 NULL 
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序号 classNo className institute grade classNum 
4 | IS1701 信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 
5 | IS18o1 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL 
6 | IS1802 信息 管理 与 信息 系统 18 02 班 | 信息 管理 学 院 2018 NULL 
7 | MP1801 | 市 场 营 销 18_01 班 工商 管理 学 院 2018 NULL 
8 | MP1802 | 市 场 营销 18_02 班 工商 管理 学 院 2018 NULL 
9 | TP1803 | 旅游 管理 18_01 班 工商 管理 学 院 2018 NULL 
表 11.7 学 生 信 息 表 Student 的 数据 
序号 sno sname sex birthday native nation classNo 
i 201712001 周 博 杰 男 1999-4-19 哈尔滨 汉族 ER1701 
2 | 201712002 寇 志 敏 女 1998-12-24 哈尔滨 汉族 ER1701 
3 | 201722003 刘波 女 1998-12-21 哈尔滨 满族 CS1701 
4 | 201723001 王 若松 男 1999-1-20 乌鲁木齐 回族 IS1701 
5 | 201723002 唐 宇 男 | 1998-10-31 沈阳 朝鲜 族 IS1701 
6 | 201723003 王 娜 女 1999-8-17 沈阳 汉族 1S1701 
7 | 201822001 唐 晓 宇 男 2000-4-15 沈阳 汉族 CS1801 
8 | 201822002 刘 方 晨 女 1999-11-11 大 连 汉族 CS1801 
9 | 201822003 王 童 靖 女 1999-10-1 大 连 汉族 CS1801 
10 | 201822004 雇 乌 宇 男 | 2000-5-20 呼和浩特 蒙古 族 CS1801 
11 | 201822005 张 岩 峰 男 2000-3-26 呼和浩特 繁 古 族 CS1801 
12 | 201823001 李 婷 婷 女 | 2000-4-5 上 海 汉族 IS1801 
13 | 201823002 梁 启 永 男 2000-6-28 大 连 汉族 IS1801 
14| 201823003 康 锣 宇 男 1999-10-1 哈尔滨 汉族 IS1801 
15 | 201823004 王 岩 女 1998-5-20 哈尔滨 满族 IS1801 
16 | 201823015 王 雅 琨 女 1999-3-26 呼和浩特 蒙古 族 1S1802 
17| 201823016 吴 敏 女 | 2000-12-21 北京 汉族 1S1802 
18 | 201823017 王 浩 达 男 | 1999-8-21 石家庄 汉族 1S1802 
19| 201823018 张 岩 田 1997-8-9 沈阳 回族 IS1802 
20 | 201825011 王 帅 男 1998-9-16 上 海 汉族 MP1801 
21| 201825013 周 星 伊 男 | 1999-2-27 北京 汉族 MP1801 
22 | 201825015 魏 子 寄 女 | 2000-3-20 乌鲁木齐 吾 尔 族 MP1801 
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表 11.8 课程 信息 表 Course 的 数据 


序号 cno cname creditHour courseHour priorCourse 
于 001 高 等 数学 6 96 NULL 
002 离散 数学 6 96 001 
3 003 计算 机 原理 4 64 NULL 
4 004 C 语言 程序 设计 6 96 003 
5 005 数据 结构 4 64 004 
6 006 数据 库 系 统 原理 5 80 005 
% 007 计算 机 网 络 5 80 003 
8 008 移动 电子 商务 3 48 007 
表 11.9 成 绩 信息 表 Score 的 数据 

序 号 sno cno score 

1 201722003 001 64 

这 201722003 002 82 

3 201722003 006 56 

4 201723001 003 69 

5 201723001 004 87 

6 201723001 005 17 

7 201723002 001 58 

8 201723002 002 38 

9 201822001 001 61 

10 201822001 002 68 

型 201822001 003 70 

12 201822001 004 58 

13 201822001 005 88 

14 201822001 006 2 

15 201822002 001 64 

16 201822002 003 60 

I 201822003 001 61 

18 201822003 002 60 

19 201823001 001 61 

20 201823001 003 98 
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续 表 


序号 sno cno score 
21 201823001 006 89 
22 201823002 001 62 
23 201823002 002 80 
24 201823002 004 47 
25 201823002 006 90 
26 201823003 001 62 
27 201823003 002 60 
28 201823003 003 69 
29 201823003 004 87 
30 201823003 005 77 
31 201823003 006 56 
32 201825011 001 54 
33 201825011 002 38 


【 例 11.3】 建立 学 生成 绩 管理 数据 库 中 的 4 张 表 。 


CREATE TABLE Course ( 


cno char (3) NOT NULL, -- 课 程 号 
cname varchar (30) NOT NULL, -课程 名 称 
creditHour numeric(1) default 0 NOT NULL, -- 学 分 
courseHour tinyint default 0 NOT NULL, -- 学 时 
priorCourse char (3) NULL, -- 先 修 课 程 


CONSTRAINT CoursePK PRIMARY KEY (cno), 

CONSTRAINT CourseFK FOREIGN KEY (priorCourse) REFERENCES Course (cno) 
); 
CREATE TABLE Class( 


classNo char (6) NOT NULL, -- 班 级 编号 
className varchar (30) NOT NULL, -=- 班 级 名 称 
institute varchar (30) NOT NULL, -- 所 属 学 院 
grade smallint default 0 NOT NULL, -- 年 级 

classNum tinyint NULL, =-- 班 级 人 数 


CONSTRAINT ClassPK PRIMARY KEY (classNo) 
); 
CREATE TABLE Student ( 


sno char (9) NOT NULL, -学 号 
sname varchar (20) NOT NULL, -- 姓 名 
sex char (2) NOT NULL, -= 性别 
birthday datetime NULL, -=- 出 生日 期 
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native varchar (20) NULL, 一 -籍贯 
nation varchar(30) default ' 汉 族 ' NULL, -民族 
classNo char (6) NULL, -班级 编号 


CONSTRAINT StudentPK PRIMARY KEY (sno), 

CONSTRAINT StudentFK FOREIGN KEY (classNo) REFERENCES Class (classNo) 
); 
CREATE TABLE Score ( 


sno char (9) NOT NULL, -- 学 号 
cno char (3) NOT NULL, -课程 号 
score numeric(5,1) default 0 NOT NULL, -- 成 绩 


CHECK (score between 0.0 and 100.0), 

CONSTRAINT ScorePK PRIMARY KEY (sno, cno), 

CONSTRAINT ScoreFK1 FOREIGN KEY (sno) REFERENCES Student (sno), 

CONSTRAINT ScoreFK2 FOREIGN KEY (cno) REFERENCES Course (cno) 
); 


2. 基本 表 的 修改 
随 着 需求 的 不 断 变 化 ,可 能 需要 对 数据 库 中 的 表 结 构 进行 相应 的 修改 ,如 增加 字段、 


删除 字段 或 是 对 已 有 字段 的 类 型 继续 修改 等 。 使 用 SQL 修改 数据 表 结 构 主 要 使 用 
ALTER TABLE 语句 ,下 面 分 别 介绍 如 何 使 用 SQL 语句 对 数据 表 进 行 字段 添加 .字段 类 
型 修改 .字段 删除 及 删除 数据 表 操 作 。 


1) 使 用 ALTER 语句 添加 字段 
添加 数据 表 字 段 的 语法 格式 如 下 。 


ALTER TABLE <tableName>ADD <columeName><dataType> 
【 例 11.4】 在 学 生 信息 表 Student 中 增加 一 列 联系 电话 telephone。 
ALTER TABLE Student ADD telephone varchar (11); 


命令 执行 完毕 后 ,打开 telephone 的 表 设 计 , 可 以 看 到 多 了 一 个 属性 列 telephone。 
2) 使 用 ALTER 语句 修改 字段 类 型 
修改 数据 表 字 段 类 型 的 语法 格式 如 下 。 


ALTER TABLE <tableName>ALTER COLUMN <columeName><newdataType> 


其 中 ,二 tableName 二 为 要 修改 的 表 名 。ALTER COLUMN 子 句 用 于 指定 将 要 更 改 的 列 
名 称 和 新 的 数据 类 型 名 称 ,二 columeName 记 参数 指定 列 名 称 , 二 newdataType 记 参数 指 
定 新 的 数据 类 型 名 称 。 
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【 例 11.5】 把 学 生 信 息 表 Student 中 的 nation 列 修改 数据 类 型 为 varchar(20) 。 
ALTER TABLE Student ALTER COLUMN nation varchar (20); 


3) 使 用 ALTER 语句 删除 字段 
删除 数据 表 字 段 的 语法 格式 如 下 。 


关系 数据 库 标准 语言 一 SQL 


ALTER TABLE <tableName> DROP COLUMN <columeName> 
【 例 11.6】 在 学 生 信息 表 Student 中 删除 联系 电话 telephone 列 。 
ALTER TABLE Student DROP COLUMN telephone; 


操作 完成 后 ,打开 学 生 信息 表 Student 的 表 设 计 , 可 以 看 到 已 无 telephone 的 属性 列 ， 
说 明 删除 属性 列 操作 成 功 。 


3. 基本 表 的 删除 


删除 表 就 是 将 表 中 数据 和 表 的 结构 从 数据 库 中 永久 性 地 去 除 。 表 被 删除 之 后 ,就 不 
能 再 恢复 该 表 的 定义 。 删 除 表 可 以 使 用 DROP TABLE 语句 来 完成 ,该 语句 的 语法 格式 
如 下 。 


DROP TABLE <tableName> 


其 中 ,一 tableName> 为 被 删除 的 表 名 。 
删除 表 时 ,系统 会 同时 从 系统 的 数据 字典 中 将 该 表 的 描述 一 起 删除 。 
【 例 11.7】 删除 TempTable 表 。 


DROP TABLE TempTable; 


11.2.3 索引 的 定义 


索引 是 数据 库 中 一 个 比较 重要 的 对 象 ,利用 索引 技术 可 以 加 快 对 表 中 数据 的 检索 。 
它 类 似 于 图 书 的 目录 ,目录 允许 用 户 不 必 翻 阅 整 本 图 书 就 能 根据 页 数 迅速 找到 所 需 内 容 。 
在 数据 库 中 ,索引 也 允许 数据 库 应 用 程序 不 必 扫描 整个 数据 库 ,就 能 迅速 找到 表 中 特定 的 
数据 。 在 图 书 中 ,目录 是 内 容 和 相应 页 码 的 列表 清单 。 在 数据 库 中 ,索引 是 表 中 数据 和 相 
应 存储 位 置 的 列表 。 

在 数据 库 的 应 用 中 ,如 何 快速 地 对 数据 库 进 行 数据 查询 十 分 重要 ,用 户 希 望 能 用 最 快 
的 速度 和 最 方便 的 方式 找到 所 需 的 数据 ,利用 数据 库 中 的 索引 可 以 快速 找到 表 或 索引 视 
图 中 的 特定 信息 。 通 过 创建 和 设计 良好 的 索引 进行 数据 查询 ,可 以 显著 提高 数据 库 查 询 
和 应 用 程序 的 性 能 ,减少 磁盘 1/O 操作 ,降低 系统 资源 的 消耗 。 

在 SQL Server 中 ,可 管理 的 最 小 空间 是 页 。 一 个 页 是 8KB 的 物理 空间 。 插 和 人 数据 
时 ,数据 就 按照 插入 的 时 间 顺 序 被 放置 在 数据 页 上 。 一 般 地 ,放置 数据 的 顺序 与 数据 本 身 
的 逻辑 关系 之 间 没 有 任何 联系 。 因 此 ,从 数据 之 间 的 逻辑 关系 看 ,数据 是 杂乱 无 章 堆 放 在 
一 起 的 。 数 据 的 这 种 堆放 方式 称 为 堆 。 当 数据 在 一 个 数据 页 上 堆 满 之 后 ,数据 就 继续 堆 
放 在 另外 一 个 数据 页 上 ,这 时 就 称 为 页 分 解 。 

数据 库 系 统 用 下 列 两 种 方法 之 一 来 访问 数据 。 

(1) 表 扫 描 ,就 是 指 系 统 将 指针 放 在 该 表 的 表 头 数据 所 在 的 数据 页 上 ,然后 按照 数据 
页 的 排列 顺序 , 逐 页 地 从 前 向 后 扫描 该 表 数 据 所 占有 的 全 部 数据 页 ,直至 扫描 完 表 中 的 全 
部 记录 。 在 扫描 时 ,如 果 找 到 符合 查询 条 件 的 记录 ,那么 就 将 这 条 记录 挑选 出 来 。 最 后 ， 
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将 全 部 挑选 出 来 符合 查询 语句 条 件 的 记录 显示 出 来 。 

(2) 使 用 索引 查找 。 索 引 是 一 种 树 状 结构 ,其 中 存储 了 关键 字 和 指向 包含 关键 字 所 
在 记录 的 数据 页 的 指针 。 当 使 用 索引 查找 时 ,系统 将 沿 着 索引 的 树 状 结构 ,根据 索引 中 的 
关键 字 和 指针 找到 符合 查询 条 件 的 记录 ,最 后 将 全 部 查找 到 的 符合 查询 语句 条 件 的 记录 
显示 出 来 。 

索引 是 一 种 与 表 或 视图 关联 的 物理 结构 ,能 以 一 列 或 多 列 的 值 为 基础 迅速 查找 表 中 
的 行 ,用 来 加 快 从 表 或 视图 中 检索 数据 行 的 速度 。 

为 什么 要 创建 索引 呢 ? 这 是 因为 创建 索引 可 以 大 大 提高 系统 的 性 能 。 

(1) 通过 创建 唯一 性 索引 ,可 以 保证 每 一 行 数据 的 唯一 性 。 

(2) 可 以 大 大 加 快 数据 的 检索 速度 ,这 也 是 创建 索引 最 主要 的 原因 。 

(3) 可 以 加 速 表 和 表 之 间 的 连接 ,特别 是 在 实现 数据 的 参考 完整 性 方面 特别 有 意义 。 

(4) 在 使 用 ORDER BY 和 GROUP BY 子 句 进行 数据 检索 时 ,同样 可 以 显著 减少 查 
询 中 分 组 和 排序 的 时 间 。 

(5) 通过 使 用 索引 ,可 以 在 查询 的 过 程 中 使 用 优化 隐藏 器 ,提高 系统 的 性 能 。 

既然 增加 索引 有 如 此 多 的 优点 ,为 什么 不 对 表 中 的 每 一 个 列 创建 一 个 索引 呢 ? 虽然 
索引 有 许多 优点 ,但 是 为 表 中 的 每 一 个 列 都 增加 索引 是 非常 不 明智 的 做 法 。 这 是 因为 增 
加 索引 也 有 以 下 缺点 。 

(1) 创建 索引 和 维护 索引 要 耗费 时 间 。 

(2) 索引 需要 占 物 理 空间 ,除了 数据 表 占 数据 空间 之 外 ,每 一 个 索引 还 要 占 一 定 的 物 
理 空间 。 如 果 要 建立 聚集 索引 ,那么 需要 的 空间 就 会 更 大 。 

(3) 当 对 表 中 的 数据 进行 增加 、 删 除 和 修改 时 ,索引 也 要 动态 地 维护 ,这 样 就 降低 了 
数据 的 维护 速度 。 

由 于 上 述 这 些 原 因 ,建立 索引 需要 花费 一 定 的 时 间 和 存储 空间 ,而 且 使 用 INSERT 
和 UPDATE 对 数据 进行 插入 和 更 新 操作 时 ,维护 索引 在 时 间 和 空间 上 也 需要 一 定 的 开 
销 , 因 此 没有 必要 对 表 中 所 有 的 列 建立 索引 ,而 应 该 根据 实际 情况 来 创建 索引 。 


1. 索引 的 建立 
创建 索引 的 语法 格式 如 下 。 


CREATE [UNIQUE] [CLUSTERED | NONCLUSTERED] 

INDEX <indexName> 

ON <tableName (<columnNamel> [ASC | DESC], 
<columnName2> [ASC | DESC], *…) 

[ON <filegroupName>] 


其 中 : 

(1) UNIOUE: 表示 创建 唯一 性 的 索引 ,这 时 在 索引 列 中 不 能 有 相同 的 两 个 列 值 
存在 。 

(2) CLUSTEREDINONCLUSTERED: 表示 创建 聚集 索引 或 非 聚 集 索引 ,默认 值 
是 非 聚 集 索引 。 聚 集 索 引 是 指数 据 库 表 行 中 数据 的 物理 顺序 与 键 值 的 逻辑 (索引 ) 顺 序 相 
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同 ,而 非 聚集 索引 的 逻辑 顺序 与 磁盘 上 行 的 物理 存储 顺序 不 同 。 

(3) 一 indexName>: 索引 的 名 称 ,索引 是 数据 库 中 的 对 象 ,因此 在 一 个 数据 库 中 必 
须 唯一 。 

(4) <tableName (<columnNamel > [ASC|IDESC],=columnName?2> [ASC | 
DESC],…): 指出 为 哪个 表 的 哪些 属性 建立 索引 ,其 中 ,[ASC|DESC] 为 按 升序 还 是 降 
序 建立 索引 ,默认 为 升序 。 

(5) LON 过 flegroupName>]: 指定 索引 文件 存放 在 哪个 逻辑 设备 上 ,该 逻辑 设备 
必须 是 在 创建 数据 库 时 定义 的 ,或 者 使 用 数据 库 的 修改 命令 加 入 到 数据 库 中 的 逻辑 设备 ， 
缺 省 该 项 时 自动 将 对 象 建立 在 主 逻 辑 设备 上 。 

【 例 11.8】 在 学 生 信息 表 中 ,首先 按照 班级 编号 的 升序 ,然后 按照 学 号 的 降序 建立 
一 个 索引 ClassSnoldx。 


CREATE INDEX ClassSnoIdx ON Student (classNo ASC, sno DESC); 


2. 索引 的 删除 


索引 一 旦 建立 ,用 户 就 不 需要 管理 它 , 由 系统 自动 维护 。 使 用 DROP INDEX 删除 索 
引 的 语法 格式 如 下 。 


DROP INDEX <indexName> 


删除 索引 的 同时 将 把 有 关 索 引 的 描述 也 从 数据 字典 中 删 去 。 
【 例 11.9】 删除 ClassSnoldx 索引 。 


DROP INDEX ClassSnoIdx; 


11.3 SQL 的 单 表 查询 


11.3.1 SELECT 语句 概述 


SELECT 语句 由 一 系列 灵活 的 子 句 组 成 ,这 些 子 句 共同 确定 检索 哪些 数据 。 用 户 使 
用 SELECT 语句 除 可 以 查看 普通 数据 库 中 的 表格 和 视图 的 信息 外 ,还 可 以 查看 SQL 
Server 的 系统 信息 。 在 介绍 SELECT 语句 实现 查询 前 ,有 必要 对 SELECT 语句 的 基本 
语法 结构 稍 做 介绍 。 

所 谓 查 询 就 是 让 数据 库 服务 器 根据 客户 端的 要 求 搜寻 出 用 户 所 需要 的 信息 资料 ， 
并 按 用 户 规定 的 格式 进行 整理 后 返回 给 客户 端 。SQL 中 用 SELECT 语句 实现 查询 。 
查询 语句 SELECT 在 任何 一 种 SQL 中 都 是 使 用 频率 最 高 的 语句 。 可 以 说 SELECT 语 
句 是 SQL 的 灵魂 。SELECT 语句 具有 强大 的 查询 功能 ,用 户 可 以 借助 于 它 实现 各 种 各 
样 的 查询 要 求 。SQL 查询 语句 的 基本 结构 包括 三 个 子 句 : SELECT、FROM 和 
WHERE, 其 中 : 
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(1) SELECT 子 句 对 应 于 关系 代数 中 的 投影 运算 ,用 来 指定 查询 结果 中 所 需要 的 属 
性 和 表达 式 。 

(2) FROM 子 句 对 应 于 关系 代数 中 的 笛 卡 儿 积 ,用 来 给 出 查询 所 涉及 的 表 , 表 可 以 
是 基本 表 、 视 图 或 查询 表 。 

(3) WHERE 子 句 对 应 于 关系 代数 中 的 选择 ,用 来 给 出 查询 结果 元 组 所 需要 满足 的 
选择 条 件 。 

虽然 SELECT 语句 的 完整 语法 比较 复杂 ,但 其 主要 子 句 可 归纳 如 下 。 

SELECT [ALL | DISTINCT] < 目标 列表 达 式 > [AS] [< 别名 >] 

[< 目标 列表 达 式 > [AS] [< 别名 >]，*…] 
FROM < 基本 表 名 | 视图 名 | 查询 表 > [AS] [< 别名 >] 
[< 基本 表 名 | 视图 名 | 查询 表 > [As] [< 别名 >],…] 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 1> [< 列 名 2>,…] 

[HAVING < 条 件 表达 式 >] ] 

[ ORDER BY < 列 名 表达 式 > ”[ASCIDESC] [,< 列 名 表达 式 > [ASCIDESC],…]] 


对 于 SQL 语句 ,SELECT 和 FROM 子 句 是 必需 的 ,其 他 的 子 句 都 是 可 选 的 。 各 子 句 
的 说 明 如 下 。 

(1) SELECT 志 目 标 列表 达 式 过, 称 为 SELECT 子 句 。 用 于 指定 整个 查询 结果 表 中 
包含 的 列 。 假 定 已 经 执行 完 FROM、WHERE .GROUP BY、HAVING 子 句 ,从 概念 上 来 
说 得 到 了 一 个 表 , 若 将 该 表 称 为 了 ,从 工 表 中 选择 SELECT 子 句 指定 的 目标 列 即 为 整个 
查询 的 结果 表 。 

(2) FROM 二 数据 源 表 二 , 称 为 FROM 子 句 。 用 于 指定 整个 查询 语句 用 到 的 一 个 或 
多 个 基本 表 或 视图 ,是 整个 查询 语句 的 数据 来 源 ,通常 称 为 数据 源 表 。 为 了 操作 方便 , 常 
常 给 表 取 一 个 别名 , 称 为 元 组 变量 。 

(3) WHERE 二 条件 表达 式 >, 称 为 WHERE 子 句 。 用 于 指定 多 个 数据 源 表 的 连接 
条 件 和 单个 源 表 中 行 的 筛选 或 选择 条 件 。 如 果 只 有 一 个 源 表 , 则 没有 表 间 的 连接 条 件 , 只 
有 行 的 筛选 条 件 。 

(4) GROUP BY 二 分 组 列 二 , 称 为 GROUP BY 子 句 。 假 定 已 经 执行 完 FROM、 
WHERE 子 句 , 则 从 概念 上 来 说 得 到 了 一 个 表 , 若 将 该 表 称 为 T1 表 , 则 GROUP BY 用 于 
指定 T1 表 按 哪些 列 ( 称 为 分 组 列 ) 进 行 分 组 ,对 每 一 个 分 组 进行 运算 ,产生 一 行 。 所 有 这 
些 行 组 成 一 个 表 , 不 妨 把 它 称 为 T2 表 ,T2 表 实 际 上 是 一 个 组 表 。 

(5) HAVING 去 组 选择 条 件 二 , 称 为 HAVING 子 句 , 与 GROUP BY 子 句 一 起 使 
用 。 用 于 指定 组 表 T2 表 的 选择 条 件 , 即 选择 T2 表 中 满足 去 组 选择 条 件 之 的 行 ,组 成 一 
个 表 。 

(6) ORDER BY 到 列 名 表达 式 >, 称 为 ORDER BY 子 句 。 若 有 ORDER BY 子 句 ， 
则 用 于 指定 查询 结果 表 T 中 按 指定 列 进 行 升序 或 降序 排序 (默认 情况 下 按 升序 排列 )， 
得 到 整个 查询 的 结果 表 。 它 是 SQL 查询 的 最 后 一 个 操作 ,必须 放 在 最 后 。 其 中 ,去 列 
名 表达 式 之 可 以 是 列 名 ,也 可 以 是 表达 式 。 排 序 有 升序 ASC 和 降序 DESC 两 种 ,默认 
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为 升序 。 


11.3.2 投影 运算 


在 SELECT 语句 中 ,只 使 用 FROM 子 句 即 可 实现 最 简单 的 列 查询 。 以 下 将 分 情况 
介绍 不 同 查询 要 求 的 具体 实现 方法 。 


1. 查询 表 中 指定 列 
在 SELECT 子 句 的 去 目标 列 名 表 之 中 指定 整个 查询 结果 表 中 出 现 的 若干 个 列 名 ,各 


列 名 之 间 用 逗号 分 隔 。 
【 例 11.10】 查询 所 有 班级 的 班级 编号 班级 名 称 和 所 属 学 院 。 


SELECT classNo, className, institute 
FROM Class; 


查询 结果 如 图 11. 2 所 示 。 

2. 查询 表 中 所 有 列 

要 查询 所 有 的 属性 列 ,SQL 可 以 使 用 两 种 方法 : 一 种 是 将 所 有 的 列 在 SELECT 子 句 
中 列 出 (可 以 改变 列 的 显示 顺序 ); 二 是 使 用 * 来 表示 所 有 属性 ,此 时 按照 表 定义 时 的 顺序 
显示 所 有 属性 。 

【 例 11. 11】〗 查询 所 有 课程 的 全 部 信息 。 


SELECT cno, cname, creditHour, courseHour, priorCourse 
FROM Course; 


SELECT * 
FROM Course; 


查询 结果 如 图 11. 3 所 示 。 


[ElassNo [classNane 
[1 |cs1701 计算 机 科学 与 技术 17_01 班 ”信息 管理 学 院 eno [enane [ereditHour [courseHour [priorCourse 
|2 |cs1801 计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 1 _|001 高 等 数学 6 96 NULL 
|3 |ER1701 金融 管理 17_01 班 金融 学 院 2 |002 离散 数学 6 96 001 
4 |IS1701 信息 管理 与 全 直系 3 |003 计算 机 原理 4 64 RULL 
5 _|IS1801 信息 管理 与 信息 系统 18_| |4 ”|004 C 语 言 程序 设计 6 96 003 
6 |Isi802 对 计时 02 班 信息 管理 学 院 [5 |005 数据 结构 4 64 004 
[了 IIP1801 市 场 营 销 18_01 班 工商 管理 学 院 6 |006 数据 库 系 统 原理 5 80 005 
8 _ |)P1802 市 场 营销 18_02 班 工商 管理 学 院 了 |007 计算 机 网 络 5 80 003 
9 |TP1803 旅游 管理 18_01 班 工商 管理 学 院 8 |008 移动 电子 商务 3 48 007 
图 11.2 例 11.10 的 查询 结果 图 11.3 例 11.11 的 查询 结果 


3. 消除 重复 元 组 
以 上 的 查询 方式 会 返回 从 表格 中 搜索 到 的 所 有 行 的 数据 ,而 不 管 这 些 数 据 是 否 重 复 ， 


151 


数据 结构 与 数据 库 应 用 教程 


这 是 用 户 所 不 希望 的 。DISTINCT 关键 字 可 以 帮助 用 户 去 掉 重复 行 ,从 而 让 返回 的 结果 


更 简洁 。 
【 例 11.12】 查询 所 有 学 院 的 名 称 。 [ER 
1 | 工商 管理 学 院 
SELECT DISTINCT institute 2 全 融 学 院 
FROM Class; 3 | 信息 管理 学 院 
» 二 a 11. 12 的 查询 结 
查询 结果 如 图 11.4 所 示 。 图 11.4 例 11.12 的 查询 结果 
4. 使 用 列 别名 


别名 ,就 是 另 一 个 名 字 , 主 要 是 为 了 方便 阅读 。 设 置 列 别 名 的 方法 是 : 原 列 名 [AS] 


列 别名 。 


【 例 11.13】 查询 所 有 班级 的 所 属 学 院 、 班 级 编号 和 班级 名 称 ,要 求 用 中 文 显示 


列 名 。 


SELECT institute 所 属 学 院 ，classNo 班级 编号 ，className 班级 名 称 
FROM Class; 


SELECT institute as 所 属 学 院 ,，classNo as 班级 编号 ，className as 班级 名 称 
FROM Class; 


查询 结果 如 图 11.5 所 示 。 
5. 使 用 表达 式 的 查询 
表达 式 可 以 是 列 名 、 常 量 、 函 数 ,或 用 列 名 、 常 量 、 函 数 等 经 过 十 (加 )、 一 ( 减 )、 


* ( 乘 )./( 除 ) 等 组 成 的 公 


【 例 11.14】 查询 每 个 班级 编号 班级 名 称 以 及 该 班级 现在 为 几 年 级 。 


SELECT (classNo) 班级 编号 ， className, year (getdate())-grade+l as 年 级 
FROM Class; 


其 中 ,函数 getdate() 可 获取 当前 系统 的 日 期 ,函数 year() 用 于 提取 日 期 中 的 年 份 , 查 


询 结 果 如 图 11.6 所 示 。 


据守 入 班级 编号 班级 名 称 班级 编号 |classNane 年 级 
|1 | 信息 管理 学 院 CS1701 ”计算 机 科学 与 技术 17_01 班 1 |Cs1701 计算 机 科学 与 技术 17_01 班 2 
[2 | 生生 CS1801 ”计算 机 科学 与 技术 18_01 班 2 _|Cs1801 计算 机 科学 与 技术 18_01 班 1 
|3 | 金融 学 院 “ER1701 ”金融 管理 17_01 班 3 _|ER1701 金融 管理 17_01 班 2 
|4 | 信息 管理 学 院 IS1701 ”信息 管理 与 信息 系统 17_01 班 4 |IS1701， 信息 管理 与 信息 系统 17_01 班 2 
|5 “| 信息 管理 学 院 IS1801 管 5 _|IS1801 信息 管理 统 18_01 班 1 
|6 | 信息 管理 学 院 IS1802 6 |IS1802 信息 管理 与 信息 系统 18_02 班 1 
T_ | 工商 管理 学 院 ]P1801 市场 营 销 18_ -01 班 7 |IP1801 市 场 营销 18_01 班 1 
8 _ | 工商 管理 学 院 ]P1802 市场 营 销 18_02 班 8 |IP1802 市 场 营销 18_02 班 1 
9 | 工商 管理 学 院 TP1803 _ 旅游 管理 18_01 班 9 _|TP1803 旅游 管理 18_01 班 1 
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11.3.3 选择 运算 


如 果 查 询 时 只 关心 满足 某 些 条 件 的 记录 , 则 此 时 可 以 用 WHERE 条 件 子 句 选 择 部 分 
记录 。 使 用 WHERE 子 句 可 以 限制 查询 的 范围 ,提高 查询 效率 。WHERE 子 句 中 的 条 件 
表达 式 包括 算术 表达 式 和 人 逻辑 表达 式 两 种 ,对 WHERE 子 句 中 的 查询 条 件 的 数目 没有 限 
制 。 二 条 件 表达 式 二 中 常用 的 运算 符 有 比较 运算 符 和 人 逻辑 运算 符 。 

比较 运算 符 用 于 比较 两 个 数值 之 间 的 大 小 是 否 相 等 。 常 用 的 比较 运算 符 有 = (等 
.二 (大 于 ) 二 (小 于 ) 二 = (大 于 或 等 于 ) .二 = (小 于 或 等 于 )、!== 或 二 二 (不 等 于 )。 
逻辑 运算 符 主要 有 以 下 几 类 。 

(1) 范围 比较 运算 符 : BETWEEN…AND…,NOT BETWEEN…AND。 

(2) 集合 比较 运算 符 : IN,NOT IN。 

(3) 字符 匹配 运算 符 : LIKE,NOT LIKE。 

(4) 空 值 比较 运算 符 ; IS NULL,IS NOT NULL。 

(5) 条 件 连接 运算 符 : AND,OR,NOT。 


1. 使 用 比较 表达 式 的 查询 
【 例 11.15】 查询 2017 级 的 班级 编号 、 班 级 名 称 和 所 属 学院 。 


于 


_ 


SELECT classNo, className, institute 
FROM Class 
WHERE grade=2017; 


查询 结果 如 图 11.7 所 示 。 


classNo |classNane jinstitute | 
1 jCs1701 计算 机 科学 与 技术 17_01 班 ”信息 管理 学 院 
|2 jER1701 金融 管理 17_01 班 融 学 

3 信息 管理 与 信 17 01 理学 院 


图 11.7 例 11.15 的 查询 结果 


【 例 11.16】 查询 年 龄 大 于 或 等 于 19 岁 的 学 生 学 号 、 姓 名 和 出 生日 期 。 


SELECT sno, sname, birthday 
FROM Student 
WHERE year (getdate())-year (birthday)>=19; 


2. 使 用 BETWEEN…AND 的 查询 

BETWEEN…AND 的 基本 格式 如 下 。 

列 名 BETWEEN 下 限 值 AND 上 限 值 
等 价 于 : 

列 名 >= 下 限 值 AND 列 名 <= 上 限 值 
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其 中 : 

(1) 列 名 可 以 是 表达 式 列 的 别名 。 

(2) BETWEEN…AND 一 般 用 于 数值 型 范围 的 比较 。 表 示 当 列 值 在 指定 的 下 限 值 
和 上 限 值 范围 内 时 ,条 件 为 TRUE ,否则 为 FALSE。 

(3) NOT BETWEEN…AND 与 BETWEEN…AND 正好 相反 ,表示 列 值 不 在 指定 
的 下 限 值 和 上 限 值 范围 内 时 ,条 件 为 TRUE ,否则 为 FALSE。 

【 例 11. 17〗 查询 成 绩 在 80 一 90 分 的 学 生 学 号 .课程 号 和 相应 的 成 绩 。 

SELECT sno, cno score 


FROM Score 
WHERE score BETWEEN 80 RND 90; 


| 
等 价 于 : 201722003 002 82 
201723001 004 87 
201822001 005 88 
SELECT sno, cno, score 201823001 006 89 
FROM Score 201823002 002 80 


201823002 006 90 
WHERE score >=80 AND score <=90; 201823003 004 87 


查询 结果 如 图 11. 8 所 示 。 图 11.8 例 11.17 的 查询 结果 
【 例 11.18】 查询 成 绩 不 在 80 一 90 分 的 学 生 学 号 .课程 号 和 相应 的 成 绩 。 


SELECT sno cno score 
FROM Score 
WHERE score NOT BETWEEN 80 AND 90; 


等 价 于 : 


SELECT sno, cno,score 
FROM Score 
WHERE score <80 AND score >90; 


3. 使 用 IN 的 查询 


运算 符 IN 的 引入 可 以 方便 地 限制 检索 数据 的 范围 ,灵活 使 用 IN 关键 字 , 可 以 用 简 
洁 的 语句 实现 结构 复杂 的 查询 。 
IN 条 件 表达 式 格式 如 下 。 


列 名 IN (常量 1, 常量 2,…, 常 量 n) 


当 列 值 与 IN 中 的 任 一 常量 值 相 等 时 ,条 件 为 TRUE, 否则 为 FALSE。 

NOT IN 与 IN 的 含义 正好 相反 , 当 列 值 与 IN 中 的 任 一 常量 值 都 不 相等 时 ,结果 为 
TRUE ,和 否则 为 FALSE。 

【 例 11. 19】 查询 选修 了 课程 号 为 “002”“004? 或 “006” 的 学 生 学 号 .课程 号 和 相应 的 


SELECT sno cno Score 
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FROM Score 
WHERE cno IN ( '002"', '004"', '006°'); 


等 价 于 : 


SELECT sno, cno, score 
FROM Score 
WHERE cno ="'002' OR cno ="004" OR cno ='006'7 


【 例 11.20】 查询 学 生 籍贯 既 不 是 “哈尔滨 ”也 不 是 "上海 ? 的 学 生 姓 名 、 籍 贯 和 所 属 
班级 编号 。 
SELECT sname, native, classNo 


FROM Student 
WHERE native NOT IN (' 了 哈尔滨 '，' 上 海 '); 


等 价 于 : 


SELECT sname, native, classNo 
FROM Student 
WHERE native != ' 哈 尔 滨 ' AND native !=' 上 海 '; 


4. 使 用 LIKE 的 查询 

在 很 多 实际 应 用 中 ,用 户 总 是 不 能 够 给 出 精确 的 查询 条 件 。 因 此 ,经 常 需要 根据 一 条 
不 确切 的 线索 来 搜索 信息 。LIKE 用 于 测试 一 个 字符 串 是 否 与 给 定 的 模式 匹配 。 所 谓 模 
式 是 一 种 特殊 的 字符 串 ,其 中 可 以 包含 普通 字符 ,也 可 以 包含 特殊 意义 的 字符 ,通常 叫 作 
通配符 。 

LIKE 运算 符 的 一 般 格 式 如 下 。 

列 名 LIKE < 模式 串 > 

模式 串 中 可 包含 的 通配符 及 其 含义 如 表 11. 10 所 示 。 

表 11.10 通配符 及 其 含义 


通配符 含义 
只 ( 百 分 号 ) 可 匹配 任意 类 型 和 长 度 的 字符 
_( 下 面 线 ) 可 匹配 任意 单个 字符 , 它 常用 来 限制 表达 式 的 字符 长 度 


查询 的 含义 是 : 如 果 在 LIKE 前 没有 NOT, 则 查询 指定 的 属性 列 值 与 字符 串 相 匹配 
的 元 组 ;如 果 在 LIKE 前 有 NOT, 则 查询 指定 的 属性 列 值 不 与 字符 串 相 匹配 的 元 组 。 

【 例 11.21】 查询 课程 名 称 中 含有 “语言 "二 字 的 课程 信息 。 

SELECT 关 


FROM Course 
WHERE cname LIKE '$ 语 言 $'; 
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【 例 11.22】 查找 不 姓 “ 王 ”的 学 生 学 号 和 姓名 。 


SELECT sno, sname 
FROM Student 
WHERE sname NOT LIKE ' 王 %$'; 


【 例 11.23】 查询 学 生 姓名 姓 “ 王 ” 且 全 名 为 三 个 汉字 的 学 生 学 号 和 姓名 。 


SELECT sno, sname 
FROM Student 
WHERE sname LIKE ' 王 _'; 


【 例 11.24】 查询 满族 的 学 生 学 号 和 姓名 。 


SELECT sno, sname 
FROM Student 
WHERE nation LIKE ' 满 族 '; 


等 价 于 : 


SELECT sno, sname 
FROM Student 
WHERE nation= ' 满 族 ' ; 


5. 基于 NULL 空 值 的 查询 


空 值 是 尚未 确定 或 不 确定 的 值 。 判 断 某 列 值 是 否 为 NULL 值 ,不 能 使 用 比较 运算 符 
等 于 和 不 等 于 ,而 只 能 使 用 如 下 专门 的 判断 空 值 的 子 句 。 

(1) 判断 列 值 为 空 的 语句 格式 为 : 列 名 IS NULL。 

(2) 判断 列 值 不 为 空 的 语句 格式 为 : 列 名 IS NOT NULL。 

【 例 11.25】 查询 先 修 课程 为 空 值 的 课程 信息 。 

SELECT * 


FROM Course 
WHERE priorCourse IS NULL; 


查询 结果 如 图 11.9 所 示 。 


[enolenane [creditHour [courseHour [priorCourse 
1 |001 高 等 数学 6 96 
2 |003 计算 机 原理 4 64 RULL 


图 11.9 例 11.25 的 查询 结果 


【 例 11.26】 查询 有 先 修 课程 的 课程 信息 。 


SELECT 关 
FROM Course 


WHERE priorCourse IS NOT NULL; 
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6. 基于 多 个 条 件 的 查询 


在 WHERE 子 句 中 ,可 以 使 用 多 个 搜索 条 件 来 选择 记录 , 即 通过 逻辑 运算 符 (NOT、 
AND 或 OR) 将 多 个 单独 的 搜索 条 件 结合 在 一 个 WHERE 子 句 中 ,形成 一 个 复合 的 搜索 
条 件 。 当 对 复合 搜索 条 件 求 值 时 ,DBMS 首先 对 每 个 单独 的 搜索 条 件 求 值 ,然后 执行 布 
尔 运算 来 决定 整个 WHERE 子 句 的 值 是 TRUE 还 是 FALSE。 只 有 那些 满足 整个 
WHERE 子 句 的 值 是 TRUE 的 记录 才 出 现在 结果 中 。 

(1) NOT 运算 符 表示 人 逻辑 “ 非 " 关 系 , 用 于 对 搜索 条 件 的 逻辑 值 求 反 。 

(2) AND 运算 符 表 示人 逻辑“ 与 "关系 。 当 使 用 AND 运算 符 组 合 两 个 逻辑 表达 式 时 ， 
只 有 当 两 个 表达 式 均 为 TRUE 时 才 返回 TRUE。 

(3) OR 运算 符 表示 逻辑 “或 "关系 。 当 使 用 OR 运算 符 组 合 两 个 逻辑 表达 式 时 ,只 要 
其 中 一 个 表达 式 的 条 件 为 TRUE ,结果 便 返回 TRUE。 

【 例 11.27】 查询 1999 年 出 生 且 民族 为 "汉族 ”的 学 生 学 号 .姓名 .出 生日 期 。 


SELECT sno, sname, birthday 
FROM Student 
WHERE year (birthday)=1999 AND nation =' 汉 族 '; 


查询 结果 如 图 11. 10 所 示 。 

【 例 11.28】 查询 班级 编号 是 “CS1801” 或 者 是 
女生 的 学 生 信息 。 

SELECT 关 


FROM Student 
WHERE classNo='CS1801' OR sex =' 女 '; 


no [snane ]birthday ] 
201712001 局 博 杰 1999-04-19 00:00:00. 000 
201723003 王 娜 ”1999-08-17 00:00:00. 000 
201822002 刘 方 晨 1999-11-11 00:00:00. 000 
201822003 王 童 清 1999-10-01 00:00:00. 000 


201823003 康 毫 宇 1999-10-01 00:00:00. 000 
201823017 王 洪 达 1999-08-21 00:00:00. 000 
201825013 周 星 伊 1999-02-27 00: 00:00. 000 


占有 自 区 上 


图 11.10 例 11.27 的 查询 结果 


11.3.4 排序 运算 


仅 使 用 SELECT 语句 获得 的 数据 是 没有 排序 的 ,为 了 方便 用 户 阅 读 和 使 用 ,往往 需 
要 对 查询 结果 进行 排序 。 在 SQL 中 ,可 使 用 ORDER BY 子 句 按 要 求 进行 排序 。 

使 用 ORDER BY 子 句 可 以 指定 在 SELECT 语句 返回 的 列 中 所 使 用 的 排序 顺序 。 

ORDER BY 排序 子 句 的 格式 如 下 。 


ORDER BY < 列 名 表达 式 > [ASC | DESC ] [pm… mn] 


其 中 ,一 列 名 表达 式 二 指定 排序 的 依据 , ASC 表示 按 列 值 升序 方式 排序 ,DESC 表示 按 列 
值 降序 方式 排序 。 如 果 没 有 指定 排序 方式 , 则 默认 的 排序 方式 为 升序 排序 。 

在 ORDER BY 子 句 中 ,可 以 指定 多 个 用 逗号 分 隔 的 列 名 。 这 些 列 出 现 的 顺序 决定 
了 查询 结果 排序 的 顺序 。 当 指定 多 个 列 时 ,首先 按 最 前 面 的 列 进行 排序 ,如 果 排 序 后 
存在 两 个 或 两 个 以 上 列 值 相同 的 行 , 则 对 这 些 值 相 同 的 行 再 依据 第 二 列 进行 排序 ,以 
此 类 推 。 
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【 例 11.29】 查询 选修 课程 号 为 "001? 的 学 生 学 号 及 成 绩 并 按 成 绩 的 降序 排序 。 


SELECT sno, Score 
FROM Score 

WHERE cno= "001" 
ORDER BY score DESC; 


查询 结果 如 图 11. 11 所 示 。 
【 例 11.30】 查询 性 别 为 “ 女 ” 的 学 生 学 号 .姓名 、 性 别 及 所 属 班级 编号 ,并 按 班级 编 
号 的 升序 .学 号 的 降序 排序 输出 。 


SELECT sno, sname, sex, classNo 
FROM Student 

WHERE sex=' 女 ' 

ORDER BY classNo, sno DESC; 


查询 结果 如 图 11. 12 所 示 。 


201722003 刘波 女 CS1701 
201822003 王 童 请 女 CS1801 
201822002 刘 方 晨 女 CS1801 
201712002 完 志 敏 女 ”ER1701 


201722003 64 
201822002 64 
201823002 62 
201823003 62 


201723003 王 卿 。 女 IS1701 
201823004 王 岩 ” 女 IS1801 
201823001 李 六 娘 女 。IS1801 
201823016 吴 敏 ” 女 IS1802 
201823015 王 雅 更 女 。IS1802 
201825015 魏 子 寄 女 了 1801 


201822003 61 
201823001 61 
201822001 61 
201723002 58 
201825011 54 


图 11.11 例 11.29 的 查询 结果 图 11.12 例 11.30 的 查询 结果 


11.3.5 查询 表 


SQL 中 的 FROM 子 句 后 面 可 以 是 基本 表 、 视 图 ,还 可 以 是 查询 表 。 
【 例 11.31】 查询 1999 年 出 生 的 且 性 别 是 “ 女 ” 的 学 生 的 基本 信息 。 
SELECT sno, sname, birthday 


FROM (SELECT * FROM Student WHERE sex=' 女 ') as a 
WHERE year (birthday)=1999; 


等 价 于 ， 


SELECT sno, sname, birthday 
FROM Student 
WHERE year (birthday)=1999 AND sex=' 女 '; 


查询 结果 如 图 11. 13 所 示 。 


201723003 王 娜 。 1999-08-17 00:00:00. 000 
201822002 刘 方 晨 1999-11-11 00:00:00.000 
201822003 王 童 清 1999-10-01 00:00:00. 000 
201823015 王 雅 更 1999-03-26 00:00:00.000 


图 11.13 例 11.31 的 查询 结果 
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11.4 SQL 的 连接 查询 


在 实际 查询 应 用 中 ,用 户 往往 需要 从 两 个 或 多 个 表 中 查询 相关 数据 ,此 时 需要 使 用 多 
表 查 询 。 多 表 查 询 用 多 个 表 中 的 数据 来 组 合 ,再 从 中 选取 所 需要 的 数据 信息 。 多 表 查 询 
实际 上 是 通过 各 个 表 之 间 的 共同 列 的 相关 性 来 查询 数据 的 ,是 数据 库 查 询 最 主要 的 特征 。 
多 表 查 询 首 先 要 在 各 个 表 之 间 建 立 连接 。 本 节 主 要 通过 多 表 查 询 操作 来 介绍 如 何 连接 多 
个 表 进 行 查询 操作 。 使 用 多 表 连 接 时 应 遵循 以 下 基本 原则 。 

(1) SELECT 子 句 列表 中 ,多 表 中 都 有 的 共同 列 前 都 要 加 上 基本 表 名 称 ; 

(2) FROM 子 句 应 包括 所 有 使 用 的 基本 表 , 多 个 基本 表 之 间 用 逗号 分 隔 ; 

(3) 表 的 连接 有 多 种 类 型 ,常见 的 有 内 连接 和 外 连接 。 内 连接 又 可 分 为 等 值 连接 、 非 
等 值 连接 和 自 表 连 接 三 种 。 


11.4.1 等 值 与 非 等 值 连接 


1. 等 值 连接 


内 连接 是 比较 常用 的 一 种 数据 连接 查询 方式 。 它 使 用 比较 运算 符 进行 多 个 基本 表 间 
的 数据 的 比较 操作 ,并列 出 这 些 基 本 表 中 与 连接 条 件 相 匹配 的 所 有 的 数据 行 。 一 般 用 
INNER JOIN 或 JOIN 关键 字 来 指定 内 连接 。 

内 连接 的 语法 格式 为 ， 

SELECT < 目标 列表 达 式 > 

FROM 表 1 INNER JOIN 表 2 [ON 连接 条 件 ] 

[WHERE < 条 件 表达 式 >] 

[ORDER BY < 列 名 表达 式 >] 


等 值 与 非 等 值 连接 就 是 在 WHERE 子 句 中 加 入 连接 多 个 关系 的 连接 条 件 , 使 用 比较 
运算 符 来 比较 连接 列 的 列 值 ,其 查询 结果 中 列 出 被 连接 表 中 的 所 有 列 , 并 且 包 括 重 复 列 。 
在 等 值 与 非 等 值 连接 中 ,可 以 使 用 的 比较 运算 符 有 = ,>, 所 ,>=, 志 = 一, 所 二 ,也 可 以 使 
用 范围 运算 符 BETWEEN 等 ,其 格式 为 : 

WHERE [< 表 1> .]< 属 性 名 1>< 比 较 运 算 符 > [< 表 2> .]< 属 性 名 2> 

[ < 人 逻辑 运算 符 > [< 表 3> .]< 属 性 名 3>< 比 较 运 算 符 > [< 表 4> .]< 属 性 名 4>… ] 


等 值 连接 查询 有 两 种 表示 方法 。 其 中 一 种 方法 是 用 WHERE 子 句 实现 连接 条 件 。 
连接 条 件 的 形式 往往 是 “主键 二 外 键 ”"。 即 按 一 个 表 的 主键 值 与 男 一 个 表 的 外 键 值 相等 的 
原则 进行 连接 。 另 一 种 方法 是 使 用 INNER JOIN 表示 的 等 值 连 接 方 法 。 以 下 举例 说 明 
不 同 的 等 值 连接 方法 。 

【 例 11.32】 查询 信息 管理 学 院 全 体 学 生 的 学 号 、 姓 名 、 籍 贯 、 班 级 编号 和 所 在 班级 
名 称 (用 WHERE 子 句 实现 )。 
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SELECT sno, sname, native, Student.classNo, className 
FROM Student, Class 
WHERE Student .classNo=Class.classNo AND institute=' 信 息 管理 学 院 '; 


在 连接 操作 中 ,如 果 涉 及 多 个 表 的 相同 属性 名 ,必须 在 相同 的 属性 名 前 加 上 表 名 加 以 
区 分 ,如 Student. classNo、Class. classNo。 

为 了 简化 ,可 为 参与 连接 的 表 取 别名 ( 称 为 元 组 变量 ) ,这 样 可 在 相同 的 属性 名 前 加 上 
表 的 别名 以 示 区 分 。 将 Student 表 取 别名 为 a, Class 表 取 别名 为 b, 班 级 编号 分 别 用 a. 
classNo 和 b. classNo 表示 。 本 例 可 以 改写 为 : 


SELECT sno, sname, native, b.classNo, className 
FROM Student RS a, Class RS b 
WHERE a.classNo=b.classNo RND institute=' 信 息 管理 学 院 '; 


或 者 


SELECT sno, sname, native, b.classNo, className 
FROM Student a Classb 
WHERE a.classNo=b.classNo AND institute=' 信 息 管理 学 院 '; 


当 执 行 该 语句 时 ,首先 执行 FROM 子 句 列 出 的 两 个 表 学 生 信 息 表 和 班级 信息 表 , 计 
算 这 两 个 表 的 笛 卡 儿 积 , 列 出 两 个 表 中 行 的 所 有 可 能 组 合 , 形 成 一 个 中 间 表 。 

随后 ,DBMS 将 执行 WHERE 子 句 ,根据 "学 生 信息 表 . 班级 编号 = 班级 信息 表 . 班级 
编号 ”关系 对 中 间 表 进行 搜索 ,去 除 那些 不 满足 该 关系 的 记录 。 

最 后 执行 SELECT 语句 ,从 执行 WHERE 子 句 后 得 到 的 中 间 表 的 每 条 记录 中 ,提取 
需要 的 字段 信息 作为 结果 表 显 示 。 

【 例 11.33】 查询 全 体 学 生 的 学 号 姓名、 籍贯 .班级 编号 和 所 在 班级 名 称 ( 用 
INNER JOIN 的 方式 实现 ) 。 


SELECT sno, sname, native, Student.classNo, className 
FROM Student INNER JOIN Class 


ON Student .classNo=Class.classNo; 
【 例 11.34】 查询 学 生 唐 晓 宇 所 选修 的 课程 号 ,课程 名 称 。 


SELECT Course.cno, cname 

FROM Course, Student, Score 

WHERE Student .sno=Score.sno 
AND Score .cno=Course.cno 


RND sname= ' 唐 晓 宇 "7 

(1) 查询 结果 为 课程 号 .课程 名 称 , 在 SELECT 子 句 中 必须 包含 这 些 属性 。 

(2) 学 号 和 姓名 在 学 生 表 中 ,课程 号 和 课程 名 称 在 课程 表 中 ,FROM 子 句 必须 包含 
学 生 表 Student 课程 表 Course; 由 于 学 生 表 与 课程 表 之 间 是 多 对 多 联系 , 需 通过 成 绩 表 
转换 为 两 个 多 对 一 的 联系 ,FROM 子 句 必须 包含 成 绩 表 Score。 

(3) 课程 号 既是 课程 表 的 主 码 ,也 是 成 绩 表 的 外 码 , 这 两 个 表 的 连接 条 件 是 课程 号 相 
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等 ;学 号 既是 学 生 表 的 主 码 , 也 是 成 绩 表 的 外 码 , 这 两 个 表 的 连接 条 件 是 学 号 相等 。 在 
WHERE 子 句 中 涉及 三 个 关系 的 连接 ,其 连接 条 件 为 : 


Course.cno=Score.cno AND Score.sno=Student .sno 


(4) 查找 “ 唐 晓 宇 ” 所 选修 的 课程 信息 ,在 WHERE 子 句 中 必须 包括 选择 条 件 sname 
二 唐 晓 宇 '。 

【 例 11.35】 查找 同时 选修 了 编号 为 “001” 和 “002” 课 程 的 学 生 学 号 、 姓 名 ,课程 号 和 
相应 成 绩 , 并 按 学 号 排序 输出 。 

(1) 查询 结果 为 学 号 姓名、 课程 号 和 相应 成 绩 ,在 SELECT 子 句 中 必须 包含 这 些 
属性 。 

(2) 由 于 学 号 和 姓名 在 学 生 表 中 ,课程 号 和 成 绩 在 成 绩 表 中 ,FROM 子 句 必须 包含 
学 生 表 Student 和 成 绩 表 Score。 

(3) 学 号 既是 学 生 表 的 主 码 ,也 是 成 绩 表 的 外 码 , 这 两 个 表 的 连接 条 件 是 学 号 相等 ， 
WHERE 子 句 必须 包含 这 个 连接 条 件 。 

SELECT a.sno, sname, b.cno, b.score 


FROM Student a, Scoreb 
WHERE a.sno=b.sno -- 表 a 与 表 b 的 连接 条 件 


(4) 为 了 表示 同时 选修 “001” 和 “002” 课 程 的 选择 条 件 ,首先 在 WHERE 子 句 中 直接 
包含 选择 条 件 cno 二 “001’ 以 查找 出 所 有 选修 了 “001” 课 程 的 同学 。 其 次 ,基于 成 绩 表 
Score 构造 一 个 查询 表 c, 查 找 出 选修 了 编号 为 “002” 课 程 的 所 有 同学 。 最 后 ,将 选修 了 编 
号 为 “001” 课 程 的 元 组 与 查询 表 c 的 元 组 关于 学 号 进行 等 值 连接 。 如 果 连 接 成 功 ,表示 该 
同学 同时 选修 了 这 两 门 课程 。 

查询 语句 为 : 

SELECT a.sno, sname, b.cno, b.score, c.cno, Cc.score 

FROM Student a, Score b, (SELECT ¥% FROM Score WHERE cno= '002') c 

WHERE b.cno= "001" 


AND a.sno=b.sno -- 表 aa 与 表 b 的 连接 条 件 
AND a.sno=c.sno -- 表 a 与 表 c 的 连接 条 件 
ORDER BY a.sno 
也 可 以 表示 为 : 


SELECT a.sno, sname, b.cno, b.score, c.cno, c.score 
FROM Student a, 
(SELECT ¥* FROM Score WHERE cno="001') b, 


(SELECT ¥* FROM Score WHERE cno="002') c 


WHERE a.sno=b.sno -- 表 aa 与 表 b 的 连接 条 件 
AND a.sno=c.sno -- 表 aa 与 表 c 的 连接 条 件 


ORDER BY a.sno 
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2. 自然 连接 


自然 连接 即 是 非 等 值 连接 。 

SQL 不 直接 支持 自然 连接 ,完成 自然 连接 的 方法 是 在 等 值 连接 的 基础 上 消除 重 
复 列 。 

【 例 11.36】 实现 班级 信息 表 Class 和 学 生 信息 表 Student 的 自然 连接 。 


SELECT a.classNo, className, institute, grade, classNum, 
sno, sname, sex, birthday, native, nation 

FROM Class a, Student b 

WHERE a.classNo=b.classNo; 


本 例 班级 编号 在 两 个 关系 中 同时 出 现 ,但 在 SELECT 子 句 中 仅 需 出 现 一 次 ,因此 使 
用 a. classNo, 也 可 以 使 用 b. classNo。 其 他 列 名 是 唯一 的 ,不 需要 加 上 元 组 变量 。 


11.4.2 自 表 连接 


若 某 个 表 与 自己 进行 连接 , 则 称 为 自 表 连接 。 在 实际 应 用 中 ,此 时 应 为 表 定 义 别 名 。 
自 表 连 接 是 一 种 特殊 的 内 连接 ,可 以 看 作 是 同一 个 表 的 两 个 副本 之 间 进 行 的 连接 。 为 了 
给 两 个 副本 命名 ,必须 为 每 一 个 表 副 本 设置 不 同 的 别名 ,使 之 在 逻辑 上 成 为 两 张 表 。 

【 例 11.37】 查询 每 门 课 的 间接 先 修 课程 ( 即 先 行 课 的 先 修 课 ) 。 

SELECT cl.cno, c2.priorCourse 


FROM Course cl, Course c2 


WHERE cl1 .priorCourse=c2.cno; 


由 于 在 Course 表 中 只 列 出 了 每 门 课程 的 直接 先 修 课 , 所 以 要 想 找到 课程 的 间接 先 修 
课 , 应 先 找到 这 门 课程 的 直接 先 修 课 , 然 后 再 按照 此 先 修 课 的 课程 号 ,查找 它 的 先 修 课 ,这 
两 步 操 作 就 相当 于 将 Course 表 与 其 自身 连接 后 ,将 第 一 个 Course 表 中 的 cno 和 第 二 个 
Course 表 中 的 priorCourse 作为 所 取 的 目标 属性 列 。 

【 例 11.38】 查找 同时 选修 了 编号 为 “001” 和 *002” 课 程 的 学 生 学 号 、 姓 名 ,课程 号 和 
相应 成 绩 ,并 按 学 号 排序 输出 。 


SELECT a.sno sname, b.cno, b.score, c.cno, c.score 
FROM Student a, Score b, Scorec 
WHERE b.cno= '001' AND c.cno="002" 

AND a.sno=b.sno AND b.sno=c.sno 


ORDER BY a.sno; 


(1) 学 生 姓 名 在 学 生 表 中 ,FROM 子 句 必须 包含 学 生 表 ( 取 别名 为 a) 。 

(2) 可 以 考虑 两 个 成 绩 表 , 分 别 记 为 b 和 c,b 表 用 于 查询 选修 了 编号 为 “001” 课 程 的 
同学 ,c 表 用 于 查询 选修 了 编号 为 “002” 课 程 的 同学 。 因 此 FROM 子 句 还 必须 包含 两 个 
成 绩 表 b 和 c, 且 在 WHERE 子 句 中 包含 两 个 选择 条 件 : 
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b.cno= '001' AND c.cno="002" 


(3) 一 方面 ,成 绩 表 b 与 成 绩 表 c 在 学 号 上 做 等 值 连接 ( 自 表 连接 ), 如 果 连 接 成 功 ， 
表示 学 生 同 时 选修 了 编号 为 “001” 和 “002” 的 课程 ; 另 一 方面 ,学 生 表 与 成 绩 表 b (或 成 绩 
表 c) 在 学 号 上 做 等 值 连接 。WHERE 子 句 包含 两 个 连接 条 件 : 


b.sno=c.sno AND a.sno=b.sno 


本 查询 结果 与 例 11. 35 相同 。 在 该 查询 中 ,FROM 子 句 后 面包 含 两 个 参与 自 表 连接 
的 成 绩 表 Score, 必 须 定义 元 组 变量 加 以 区 分 , 自 表 连 接 的 条 件 是 b. sno==c. sno。 


11.4.3 外 连接 


内 连接 把 两 个 表 连 接 成 一 个 表 ,结果 表 中 仅 包含 原 表 中 满足 连接 条 件 的 行 ,前面 介 
绍 的 等 值 连接 和 非 等 值 连接 都 属于 内 连接 范畴 。 在 一 般 的 连接 中 ,只 有 满足 连接 条 件 
的 元 组 才 被 检索 出 来 ,对 于 没有 满足 连接 条 件 的 元 组 是 不 作为 结果 被 检索 出 来 的 。 如 
例 11. 36 ,查询 结果 如 图 11. 14 所 示 。 


elassNo 
1 ER1701 金融 管理 17-01 王 a 2017 201712001 六 男 ”1999-04-19 00 .000 哈尔滨 汉族 
ER1701 金融 管理 17_01 班 金融 学 院 2017 mt 201712002 寇 志 敏 女 。1998-12-24 00: ,000 哈尔滨 汉族 


.000 哈尔滨 清 族 


区 
|3 jcsi701 计算 机 科学 与 技术 17_01 班 ”信息 管理 学 院 2017 NULL ”201722003 刘波 女 “1998-12-21 00: 
a . 000 乌鲁木齐 回族 


_|IS1701 信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 201723001 王 若松 男 1999-01-20 00: 


5 |1S1701 信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL “201723002 唐 字 男 1998-10-31 00 .000 沈阳 。 朝鲜 族 
6 |IS1701 信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 201723003 王 娜 ” 女 1999-08-17 00: .000 沈阳 ”汉族 
| 于 |cs1801 计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL ”201822001 唐 晓 宇 男 “2000-04-15 00: .000 沈阳 汉族 
|8 csi801 计算 机 科学 与 技术 18_01 班 信息 管理 学 院 2018 NULL ”201822002 刘 方 蝴 女 。1999-11-11 00: .000 大 连 。 ”汉族 
9 “|cs1801 计算 机 科学 与 技术 18_01 班 “信息 管理 学 院 2018 NULL ”201822003 王 童 清 女 。1999-10-01 00 .000 大 连 汉族 


,000 呼和浩特 蒙古 族 
.000 呼和浩特 蒙古 族 


10 cs1801 计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 。 ”201822004 摩 益 字 男 ”2000-05-20 00: 
1 |cs1801 计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 。 ”201822005 张 尖峰 男 ”2000-03-26 00: 


IS1801 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL ”201823001 李 婷 娘 女 。2000-04-05 00 .000 上 海 。 汉族 

IS1801 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL ”201823002 梁 启 永 男 ”2000-06-28 00 .000 大 连 ”汉族 

IS1801 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL ”201823003 康 准 字 男 ”1999-10-01 00 .000 哈尔滨 ”汉族 
|15 |IS1801 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL 201823004 王 岩 ” 妆 ”1998-05-20 00 .000 哈尔滨 满族 
|16 |Is1802 信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL ”201823015 王 雅 更 女 。 1999-03-26 00 .000 呼和浩特 蒙古 族 
|17 |IS1802 信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL “201823016 吴 敏 ” 女 2000-12-21 00 .000 北京 。 汉族 
18 |IS1802 信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL ”201823017 王 浩 达 男 “ 1999-08-21 00; .000 石家庄 。 汉族 
|19 |IS1802 信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL “201823018 张 岩 。 男 1997-08-09 00 .000 沈阳 ”回族 
20 |IP1801 市 场 营销 18_01 班 工商 管理 学 院 2018 NULL 201825011 王 籼 ” 男 1998-09-16 00: .000 上 海 汉族 
21 P1801 市 场 营销 18_01 班 工商 管理 学 院 2018 NULL ”201825013 周 星 伊 男 1999-02-27 00 .000 北京 。 汉族 


S88s88s8sssssssssssssssss 


[22 wpP1801 市 场 营销 18_01 班 工商 管理 学 院 2018 NULL 201825015 魏 子 春 女 2000-03-20 00:00:0 


图 11.14 例 11.36 的 查询 结果 


.000 乌鲁木齐 维吾尔 族 


班级 信息 表 Class 的 查询 结果 如 图 11. 15 所 示 , 从 结果 中 可 以 看 出 : 班级 表 中 的 “市 
场 营销 18_02 班 " 和 “旅游 管理 18_01 班 ”这 两 个 班 没 有 出 现在 查询 结果 中 ,原因 是 这 两 个 
班 没 有 学 生 


CS1701 计算 机 科学 与 技术 17_01 班 ”信息 管理 学 院 2017 
CS1801 计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 
ER1701 金融 管理 17_01 班 金融 学 院 2017 NULL 
IS1701 信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 
IS1801 信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL 
IS1802 信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL 
取 1801 市 场 营 销 18_01 班 工商 管理 学 院 2018 NULL 
到 1802 市 场 营销 18_02 班 工商 管理 学 院 2018 NULL 
TP1803 旅游 管理 18_01 班 工商 管理 学 院 2018 NULL 


图 11.15 班级 信息 表 Class 的 查询 结果 
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内 连接 可 以 消除 与 男 一 个 表 的 任何 行 都 不 匹配 的 行 , 在 实际 应 用 中 ,往往 需要 将 不 满 
足 连 接 条 件 的 元 组 也 检索 出 来 ,只 是 在 相应 的 位 置 用 空 值 蔡 代 ,这 种 查询 称 为 外 连接 查 
询 。 在 外 连接 中 参与 连接 的 表 有 主 从 之 分 ,以 主 表 中 的 每 行 数据 去 匹配 从 表 中 的 数据 行 ， 
如 果 符 合 连接 条 件 , 则 直接 返回 到 查询 结果 中 ;如 果 主 表 中 的 行 在 从 表 中 没有 找到 匹配 的 
行 , 与 内 连接 不 同 的 是 ,在 外 连接 中 主 表 的 行 仍然 保留 ,并且 返回 到 查询 结果 中 ,相应 的 从 
表 中 的 行 中 被 十 上 空 值 后 也 返回 到 查询 结果 中 。 

外 连接 可 以 分 为 左 外 连接 、 右 外 连接 和 全 外 连接 三 种 类 型 。 外 连接 的 语法 格式 如 下 。 


SELECT < 目标 列表 达 式 > 

FROM 表 1 <LEFT|RIGHT|FULL> [OUTER] JOIN 表 2 [ON 连接 条 件 ] 
[WHERE< 条 件 表达 式 >] 

[ORDER BY < 列 名 表达 式 >] 


1. 左 外 连接 


左 外 连接 的 连接 结果 中 包含 左 关系 中 的 所 有 元 组 ,对 于 左 关系 中 没有 连接 上 的 元 组 ， 
其 右 关系 中 的 相应 属性 用 空 值 替 代 。 与 内 连接 相 比 , 左 外 连接 除了 包含 两 个 表 的 匹配 行 
外 ,还 包括 FROM 子 句 中 JOIN 关键 字 左 边 表 的 不 匹配 行 。 左 外 连接 的 结果 可 以 表示 
如 下 。 
左 外 连接 = 匹配 行 十 左边 表 中 不 匹配 的 行 
其 中 ,缺少 的 右边 表 中 的 列 值 用 NULL 表示 。 
【 例 11.39】 实现 班级 信息 表 Class 和 学 生 信息 表 Student 的 左 外 连接 。 


SELECT a.classNo, className, institute, grade, classNum, 
sno, sname, sex, birthday, native, nation 
FROM Class a LEFT OUTER JOIN Student b 


ON a.classNo=b.classNo; 
该 查询 也 可 以 表示 为 : 


SELECT a.classNo, className, institute, grade, classNum, 
sno, sname, sex, birthday, native, nation 

FROM Class a, Student b 

WHERE a.classNo* =b.classNo; 


查询 结果 如 图 11. 16 所 示 。 
2. 右 外 连接 


右 外 连接 的 连接 结果 中 包含 右 关系 中 的 所 有 元 组 ,对 于 右 关系 中 没有 连接 上 的 元 组 ， 
其 左 关系 中 的 相应 属性 用 空 值 蔡 代 。 与 内 连接 相 比 , 右 外 连接 除了 包含 两 个 表 的 匹配 行 
外 ,还 包括 FROM 子 句 中 JOIN 关键 字 右边 表 的 不 匹配 行 。 右 外 连接 的 结果 可 以 表示 
如 下 。 
右 外 连接 一 匹配 行 十 右边 表 中 不 匹配 的 行 


-人 14 


1 |csi7ol 
2 |cs1801 
3 |cs1801 
4 |c51801 
5 |cs1801 
6 
了 
9 


CS1801 
ER1701 
ER1701 
IS1701 
10 |Is1701 
11 |Isi701 
12 |Isi801 
13 |Is1801 
14 |Is1801 
15 |Is1801 
16 |IS1802 
17 |Is1802 
18 |Is1802 
19 |Is1802 
20 [NP1801 
21 P18o1 
22 P1801 
23 |iP1802 
24 |TP1803 


iclassNo 


图 11.16 例 11.39 的 查询 结果 


其 中 ,缺少 的 左边 表 中 的 列 值 用 NULL 表示 。 


【 例 11.40】 


[classNane Jinstitute |grade|classNun sno snane sex birthday 
计算 机 科学 与 技术 17_01 班 ”信息 管理 学 院 2017 NULL ”201722003 刘波 “ 女 。 1998-12-21 
计算 机 科学 与 技术 18_01 班 管理 学 院 2018 NULL 201822001 唐 晓 宇 男 “2000-04-15 
计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 201822002 刘 方 县 交 。 1999-11-11 
计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 201822003 王 童 清 女 。 1999-10-01 
计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 201822004 摩 会 宇 男 “2000-05-20 
计算 机 科学 与 技术 18_01 班 ”信息 管理 学 院 2018 NULL 201822005 张 岩 峰 男 。 2000-03-26 
金融 管理 17_01 班 金融 学 院 ”2017 NULL 201712001 周 博 杰 男 。 1999-04-19 
金融 管理 17_01 班 金融 学 院 。 “2017 NULL ”201712002 寇 志 教 女 。 1998-12-24 
信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL “201723001 王 若松 男 1999-01-20 
信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 201723002 唐 字 男 。 1998-10-31 
信息 管理 与 信息 系统 17_01 班 信息 管理 学 院 2017 NULL 201723003 王 思 ” 女 。 1999-08-17 
信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL 201823001 李 婷 婷 女 。 2000-04-05 
信息 管理 与 信息 系统 18_01 班 信息 管理 学 院 2018 NULL 201823002 梁 启 永 男 “2000-06-28 
信息 管理 与 201823003 康 半 宇 男 。 1999-10-01 
信息 管理 与 | 201823004 王 岩 ” 女 。 1998-05-20 
信息 管理 与 | 201823015 王 雅 现 女 。 1999-03-26 
信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 201823016 吴 敬 ” 女 。 2000-12-21 
信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL 201823017 王 浩 达 男 。 1999-08-21 
信息 管理 与 信息 系统 18_02 班 信息 管理 学 院 2018 NULL 201823018 张 岩 。 男 1997-08-09 
市 场 营销 18_01 班 工商 管理 学 院 2018 NULL 201825011 王 帅 。 男 1998-09-16 
市 场 营销 18_01 班 工商 管理 学 院 2018 NULL 201825013 周 星 伊 男 。 1999-02-27 
市 场 营销 18_01 班 工商 管理 学 院 2018 NULL 201825015 魏 子 春 女 。 2000-03-20 
市 场 营销 18_02 班 工商 管理 学 院 2018 NULL NULL NULL NULL NULL 
旅游 管理 18_01 班 工商 管理 学 院 2018 RULL NULL NULL NULL NULL 


SELECT a.classNo, className, institute, grade, classNum, 


sno, sname, sex, birthday, native, nation 
FROM Class a RIGHT OUTER JOIN Student b 


ON a.classNo=b.classNo; 


该 查询 也 可 以 表示 为 : 


SELECT a.classNo, className, institute, grade, classNum, 


sno, sname, sex, birthday, native, nation 
FROM Class a, Student b 
WHERE a.classNo= x* b.classNo; 


3. 全 外 连接 


全 外 连接 的 连接 结果 中 包含 左 、 右 关系 中 的 所 有 元 组 。 对 左 关系 中 没有 连接 上 的 元 
组 ,其 右 关 系 中 的 相应 属性 用 空 值 蔡 代 ,对 右 关 系 中 没有 连接 上 的 元 组 ,其 左 关系 中 的 相 
应 属性 用 空 值 蔡 代 。 全 外 连接 使 用 FULL OUTER JOIN 关键 字 对 两 个 表 进行 连接 。 这 


种 连接 方式 返回 左 表 和 右 表 中 的 所 有 行 。 


00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 
00: 


:00. 
:00. 
:00， 
:00. 
:00. 
:00. 
:00. 
:00. 
:00. 
:00. 
:00. 
:00， 
:00. 
:00. 
:00. 
:00. 
:00. 
:00. 
:00， 
:00. 
:00. 
3:00. 


[native [nation | 
000 哈尔滨 清 族 
000 沈阳 ”汉族 
.000 大 连 。 ”汉族 
000 大 连 “汉族 


000 哈尔滨 “汉族 
000 哈尔滨 ”汉族 
000 乌鲁木齐 回族 
.000 沈阳 朝鲜 族 
000 沈阳 汉族 
.000 上 海 。 ”汉族 
000 大 连 ”汉族 


000 哈尔滨 清 族 
000 呼和浩特 蒙古 族 
000 北京 。 汉族 
000 石家庄 。 汉族 
.000 沈阳 ”回族 
000 上 海 。 汉族 
000 北京 。 汉族 
000 乌鲁木齐 维吾尔 族 
NULL NLL 
NULL NULL 


000 呼和浩特 蒙古 族 
000 呼和浩特 蒙古 族 


000 哈尔滨 ”汉族 


实现 班级 信息 表 Class 和 学 生 信 息 表 Student 的 右 外 连接 。 


当 某 行 在 一 个 表 中 没有 匹配 的 行 时 , 则 另 一 个 


表 与 之 相对 应 列 的 值 为 NULL。 如 果 表 之 间 有 匹配 的 行 , 则 整个 结果 集 包 含 表 的 数 


据 值 。 


【 例 11.41】 实现 班级 信息 表 Class 和 学 生 信息 表 Student 的 全 外 连接 。 


SELECT a.classNo, className, institute, grade, classNum, 


sno, sname, sex, birthday, native, nation 


FROM Class a FULL OUTER JOIN Student b 


165 


-一 16 


数据 结构 与 数据 库 应 用 教程 


ON a.classNo=b.classNo; 


11.5 SQL 的 聚合 查询 


SQL 查询 提供 了 丰富 的 数据 分 类 、 统 计 和 计算 的 功能 ,其 统计 功能 通过 聚合 函数 来 
实现 ,分 类 功能 通过 分 组 子 句 来 实现 ,并 且 统 计 和 分 组 往往 结合 在 一 起 实现 丰富 的 查询 


功能 。 


11.5.1 聚合 函数 


聚集 函数 (Aggregate Function) 也 称 为 集合 函数 或 统计 函数 ,其 作用 是 对 一 组 值 进行 
计算 并 返回 一 个 值 。 常 用 聚合 函数 及 其 功能 介绍 如 表 11. 11 所 示 。 


表 11.11 常用 聚合 函数 


聚合 函数 


功 能 


count(*) 


求 表 中 或 组 中 记录 的 个 数 


count( [DISTINCT | ALL] {过 列 名 二 )} ) 


求 关系 的 元 组 个 数 或 一 列 中 值 的 个 数 


sum( [DISTINCT | ALL] 二 列 名 之 ) 


求 该 列 所 有 值 的 总 和 (必须 是 数值 型 列 ) 


avg( [DISTINCT | ALL] 二 列 名 二 ) 


求 该 列 所 有 值 的 平均 值 (必须 是 数值 型 列 ) 


max( [DISTINCT | ALL] 一 列 名 之 ) 


求 该 列 所 有 值 的 最 大 值 (必须 是 数值 型 列 ) 


min( [DISTINCT | ALL] 二 列 名 之 ) 


求 该 列 所 有 值 的 最 小 值 (必须 是 数值 型 列 ) 


如 果 指 定 DISTINCT 谓词 ,表示 在 计算 时 首先 消除 二 列 名 二 取 重复 值 的 元 组 ,然后 
再 进行 统计 ;指定 ALL 谓词 或 没有 DISTINCT 谓词 ,表示 不 消除 二 列 名 二 取 重 复 值 的 


元 组 。 
【 例 11.42】 查询 学 生 总 人 数 。 


SELECT COUNT (* ) 总 人 数 
FROM Student; 


查询 结果 如 图 11.17 所 示 。 


【 例 11.43】 查询 所 有 选课 学 生 的 人 数 。 


SELECT count (sno) 学 生 人 数 
FROM Score; 


图 11.17 例 11.42 的 查询 结果 


查询 结果 是 33。 由 于 一 个 学 生 可 以 选修 多 门 课程 ,学 号 存在 重复 ,为 消除 重复 的 元 组 ,使 


用 DISTINCT 短语 ,将 查询 修改 为 : 


SELECT count (DISTINCT sno) 学 生 人 数 


FROM Score7 
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则 其 查询 结果 为 10。 
【 例 11.44】 查询 学 号 为 “201822001? 的 学 生 所 选修 课程 的 总 学 分 。 


SELECT sum(creditHour) 总 学 分 
FROM Score a, Course b 


WHERE sno= '201822001' RND a.cno=b.cno; 


如 果 该 学 生 选 修 同 一 门 课 程 两 次 , 则 该 课程 的 学 分 会 重复 计算 两 次 。 在 聚合 函数 遇 
到 空 值 时 , 除 count( x* ) 外 所 有 的 函数 皆 跳 过 空 值 , 只 处 理 非 空 值 。 


11.5.2 分 组 聚合 


在 SQL 查询 中 ,有 时 需要 把 FROM、WHERE 子 句 产生 的 表 按 某 种 原则 进行 分 类 运 
算 ( 即 分 组 运算 ) ,然后 再 对 每 个 组 进行 统计 ,一 组 形成 一 行 ,最 后 把 所 有 这 些 行 组 成 一 
表 , 称 为 组 表 。 分 组 运算 的 目的 是 为 了 细 化 聚合 函数 的 作用 对 象 。 如 果 不 对 查询 结果 分 
组 , 则 聚合 函数 作用 于 整个 查询 结果 ;如 果 对 查询 结果 进行 分 组 , 则 聚合 函数 分 别 作用 于 
每 个 组 ,查询 结果 是 按 组 聚合 输出 。SQL 通过 GROUP BY 和 HAVING 子 句 实现 分 组 
运算 ,其 中 : 

(1) GROUP BY 子 句 对 查询 结果 按 某 一 列 或 某 几 列 进行 分 组 , 值 相等 的 分 为 一 组 。 

(2) HAVING 子 句 对 分 组 的 结果 进行 选择 , 仅 输出 满足 条 件 的 组 。 该 子 句 必须 与 
GROUP BY 子 句 配 合 使 用 。 

【 例 11.45】 查询 每 门 课程 的 被 选 人 数 .平均 分 和 最 高 分 。 


SELECT cno，count (x ) 被 选 人 数 ，avg (score) 平均 分 ， max (score) 最 高 分 


rT 
GROUP BY cno; 本 上 777777 64 
60.857142 82 
本 一 73. 200000 98 
查询 结果 如 图 11. 18 所 示 。 69. 750000 87 
本 | [= > 一 80. 666666 88 
查询 结果 按 课 号 cno 分 组 ,将 具有 相同 cno 值 的 元 组 ”| 72.600000 90 


作为 一 组 ,然后 对 每 组 进行 相应 的 计数 、 求 平均 值 和 求 最 图 11.18 例 11.45 的 查询 结果 
大 值 。 如 果 有 以 下 的 查询 语句 出 现 : 
SELECT cno，score, count (* ) 被 选 人 数 ，avg (score) 平均 分 ， max (score) 最 高 分 
FROM Score 
GROUP BY cno; 
则 系统 会 出 现 如 图 11. 19 所 示 的 错误 ,原因 在 于 “score” 列 既 不 包含 在 聚合 函数 中 ,又 不 
包含 在 GROUP BY 子 句 中 。 


到 秀 桥 : 消息 8120， 焉 列 16， 笑 
列 “Score. score” 在 选择 列 最 本 因为 该 列 卫 不 包含 在 守 全 卫 数 中 ， 也 不 包含 在 6ROUP_BY 子 句 中 。 
图 11.19 GROUP BY 使 用 错误 提示 


当 GROUP BY 子 句 中 用 于 分 组 的 列 中 出 现 NULL 值 时 ,GROUP 子 句 会 将 所 有 的 
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NULL 值 分 在 同一 组 , 即 认为 它们 是 “相等 ?的 。 


仅 使 用 GROUP BY 子 句 分 组 时 ,会 将 所 有 的 分 组 作为 结果 返回 。 如 果 只 想 搜索 那 


些 满足 某 些 条 件 的 分 组 ,需要 对 分 组 进行 选择 。 在 SQL 中 ,可 以 使 用 HAVING 子 句 对 
分 组 进行 筛选 。 


【 例 11.46】 查询 平均 分 在 70 分 以 上 的 每 门 课程 的 被 选 人 数 .平均 分 和 最 高 分 。 


SELECT cno，count (* ) 被 选 人 数 ，avg (score) 平均 分 ,max (score) 最 高 分 
FROM Score 

GROUP BY cno 

HAVING avg (score)>=70; 


该 查询 用 HAVING 作用 于 分 组 ,对 分 组 进行 过 滤 。 

【 例 11.47】 查询 成 绩 最 高 分 的 学 生 的 学 号 .课程 号 和 相应 成 绩 。 
SELECT sno, cno, Score 

FROM Score 


WHERE score= (SELECT max (score) 
FROM Score) 7 


聚合 函数 可 直接 用 在 HAVING 子 句 中 (如 例 11. 46) ,聚合 函数 也 可 用 于 子 查询 中 


(如 例 11.47) ,但 聚合 函数 不 可 以 直接 使 用 在 WHERE 子 句 中 。 如 下 语句 是 不 正确 的 。 


SELECT * 
FROM Score 


WHERE score=max (score); 


系统 会 出 现 如 图 11. 20 所 示 的 错误 。 


服务 器 ; 消息 147， 级 别 15， 状 态 1， 
形 合 不 应 出 现在 WHERE 子 句 中 ， 除 非 


【 例 11.48】 查询 获得 的 总 学 分 ( 注 : 只 有 成 绩 合 格 才能 获得 该 课程 的 学 分 ) 大 于 或 


等 于 20 的 学 生 的 学 号 ,姓名 和 总 学 分 ,并 按 学 号 升序 输出 。 


SELECT a.sno, sname, sum(creditHour) 

FROM Student a, Course b, Scorec 

WHERE a.sno=c.sno AND c.cno=b.cno AND score>=60 

GROUP BY a.sno, sname -- 输 出 结果 的 需要 
HAVING sum (creditHour)>=20 

ORDER BY a.sno; 


由 于 本 例 输出 结果 中 需要 同时 包含 学 号 和 姓名 ,因此 ,GROUP BY 子 句 需要 按 a. 


sno，sname 进行 聚合 ,不 能 仅 按 a. sno 进行 聚合 ,否则 无 法 输出 sname。 


本 查询 既 使 用 了 WHERE 子 句 ,也 使 用 了 HAVING 子 句 ,它们 都 是 选择 满足 条 件 的 


元 组 ,但 是 其 选择 的 范围 是 不 一 样 的 ,表现 在 以 下 两 个 方面 。 


168 


(1) WHERE 子 句 : 作用 于 整个 查询 对 象 ,对 元 组 进行 过 滤 。 


关系 数据 库 标准 语言 一 SQL 


(2) HAVING 子 句 : 仅 作用 于 分 组 ,对 分 组 进行 过 滤 。 

本 例 的 查询 过 程 如 下 。 

(1) 首先 在 Score 表 中 选择 课程 成 绩 大 于 等 于 60 分 的 元 组 (只 有 60 分 及 以 上 才能 获 
得 学 分 ) ,将 这 些 元 组 与 Student 和 Score 表 进 行 连 接 ,形成 一 个 新 关系 ; 

(2) 在 新 关系 中 按 学 号 进行 分 组 ,统计 每 组 的 总 学 分 ; 

(3) 将 总 学 分 大 于 或 等 于 20 的 组 选择 出 来 形成 一 个 结果 关系 ; 

(4) 将 结果 关系 输出 。 


11.6 SQL 的 府 套 子 查询 


子 查询 指 的 是 一 个 SELECT 查询 语句 骨 套 在 SELECT、INSERT、UPDATE、 
DELETE 语句 或 其 他 子 查 询 语 句 中 。 通 常 把 外 层 的 SELECT 语句 叫 作 外 查询 ,内 层 的 
SELECT 语句 叫 作 内 查询 (或 子 查询 ) 。 子 查询 要 用 圆 括号 括 起 来 , 它 可 以 出 现在 允许 使 
用 表达 式 的 任何 地 方 。 

嵌 套 子 查询 是 指 作为 子 查询 的 查询 能 够 独立 运行 ,并 不 依赖 外 部 查询 的 数据 和 结果 。 
执行 过 程 是 先 执行 子 查询 , 子 查询 的 结果 并 不 显示 出 来 ,而 是 作为 外 查询 的 条 件 值 ,然后 
执行 外 查询 。 岩 套子 查询 的 特点 是 : 子 查 询 只 执行 一 次 ,其 查询 结果 不 依赖 于 外 查询 。 
而 外 查询 的 查询 条 件 依赖 于 子 查询 的 结果 ,因此 ,也 可 以 说 外 查询 的 查询 结果 依赖 于 子 查 
询 的 结果 。 


11.6.1 使 用 IN 的 子 查询 


查询 的 结果 可 以 是 一 行 或 多 行 。 返 回 多 行 的 内 套子 查询 通常 用 在 IN NOT IN 
之 后 。 
【 例 11.49】 查询 学 生 唐 晓 宇 所 选修 的 课程 号 。 


SELECT cno 
FROM Score 
WHERE sno IN (SELECT sno FROM Student WHERE sname= ' 唐 晓 宇 ') 7 


在 本 例 中 , WHERE 子 句 用 于 检测 元 素 与 集合 间 的 属于 关系 ,其 中 ,sno 为 元 素 ,IN 
为 “属于 ”, 骨 套 语句 “SELECT sno FROM Student WHERE sname= ' 唐 晓 宇 ” 的 查询 结 
果 为 所 有 名 字 为 “ 唐 晓 宇 ” 的 学 生 的 学 号 集合 。 该 嵌 套 SELECT 语句 称 为 子 查询 。 

该 查询 属于 非 相 关子 查询 ,其 查询 过 程 如 下 。 

(1) 从 Student 表 中 查询 出 学 生 的 学 号 sno, 构 成 一 个 中 间 结 果 关 系 7; 

(2) 从 Score 表 中 取出 第 一 个 元 组 1; 

(3) 如 果 元 组 上 的 sno 属性 的 值 包含 在 中 间 结 果 关 系 中 ( 即 1 snoE7), 则 将 元 组 
的 cno 属性 的 值 作为 最 终 查 询 结果 关 系 的 一 个 元 组 ,否则 丢弃 元 组 二 

(4) 如 果 Score 表 中 还 有 元 组 , 则 取 Score 表 的 下 一 个 元 组 1, 并 转 第 (3) 步 ,否则 转 第 
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(5) 步 ; 


(5) 将 最 终结 果 关系 显示 出 来 。 
【 例 11.50】 查询 学 生 唐 晓 宇 所 选修 的 课程 号 .课程 名 称 。 


SELECT cno, cname 
FROM Course 
WHERE cno IN 
(SELECT cno 
FROM Score 


WHERE sno IN 


(SELECT sno 


WHERE 子 句 中 的 IN 可 以 实现 多 重 嵌 套 , 本 例 是 一 个 三 重 嵌 套 的 例子 。 

该 查询 也 属于 非 相关 子 查询 ,使 用 IN 的 非 相 关子 查询 的 查询 过 程 归 纳 如 下 。 

(1) 首先 执行 最 底层 的 子 查 询 块 ,将 该 子 查询 块 的 结果 作为 中 间 关 系 。 

(2) 执行 上 一 层 ( 即 外 一 层 ) 查 询 块 ,对 于 得 到 的 每 个 元 组 ,判断 该 元 组 是 否 在 它 的 子 
查询 结果 中 间 关 系 中 ;如 果 在 ,取出 该 元 组 中 的 相关 属性 作为 最 终 输出 结果 (或 该 查询 块 


FROM Student 
WHERE sname= ' 唐 晓 宇 ')) 7 


的 查询 结果 中 间 关 系 ) 的 一 个 元 组 ;否则 舍弃 该 元 组 。 


(3) 如 果 已 经 执行 完 最 上 层 查 询 块 , 则 将 最 终结 果 作为 一 个 新 关系 输出 ;否则 返回 第 


(2) 步 重复 执行 。 


11.6.2 使 用 比较 运算 符 的 子 查询 


查询 的 结果 可 以 是 一 行 或 多 行 。 返 回 多 行 的 嵌 套 子 查询 通常 用 在 比较 运算 符 ( 一 ， 
<<>,>，,>=, 志 ,<=) 与 ANY、ALL 组 成 的 运算 符 之 后 。 常 用 到 谓词 ANY 和 ALL， 
ANY 表示 子 查询 结果 中 的 某 个 值 ;ALL 表示 子 查询 结果 中 的 所 有 值 。 具 体 比 较 运 算 符 
及 其 含义 如 表 11. 12 所 示 。 凡 是 表达 式 可 以 出 现 的 任何 地 方 几 乎 都 可 以 使 用 子 查询 ,只 
是 SQL 对 子 查询 的 结果 施加 了 某 些 限制 ,即将 子 查询 用 作 比 较 运算 符 之 后 的 表达 式 中 ， 


该 子 查询 必须 返回 单 值 。 
表 11.12 比较 运算 符 
比较 运算 符 含义 
> ANY 大 于 子 查询 结果 中 的 某 个 值 
> ALL 大 于 子 查询 结果 中 的 所 有 值 
< ANY 小 于 子 查询 结果 中 的 某 个 值 
< ALL 小 于 子 查询 结果 中 的 所 有 值 
>= ANY 大 于 或 等 于 子 查询 结果 中 的 某 个 值 
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续 表 
比较 运算 符 含义 
>= ALL 大 于 或 等 于 子 查询 结果 中 的 所 有 值 
<= ANY 小 于 或 等 于 子 查询 结果 中 的 某 个 值 
<= ALL 小 于 或 等 于 子 查询 结果 中 的 所 有 值 
= ANY 等 于 子 查询 结果 中 的 某 个 值 
=ALL 等 于 子 查 询 结 果 中 的 所 有 值 (通常 没有 实际 意义 ) 
!=( 或 <>>)ANY 不 等 于 子 查询 结果 中 的 某 个 值 
!= (或 <>)ALL 不 等 于 子 查询 结果 中 的 任何 一 个 值 


【 例 11.51】 求 比 学 号 为 “201822001? 的 学 生 所 有 成 绩 低 的 学 生 学 号 。 


SELECT sno 
FROM Score 
WHERE score <ALL (SELECT score FROM Score WHERE sno="'201822001°'); 


等 价 于 : 
SELECT sno 
FROM Score 


WHERE score < (SELECT min (score) FROM Score WHERE sno= '2018220017) 7 


比 所 有 成 绩 低 的 学 生 , 可 以 使 用 二 ALL 来 进行 查询 ,也 可 以 用 聚合 函数 min() 来 
查询 。 

【 例 11.52】 求 比 学 号 为 “201822001? 的 学 生 某 一 个 成 绩 低 的 学 生 学 号 。 

SELECT sno 


FROM Score 
WHERE score <ANY (SELECT score FROM Score WHERE sno="'201822001°'); 


等 价 于 ; 


SELECT sno 
FROM Score 


WHERE score < (SELECT max (score) FROM Score WHERE sno="'201822001"'); 


比 某 一 个 成 绩 低 的 学 生 ,可 以 使 用 二 ANY 来 进行 查询 ,也 可 以 用 聚合 函数 max() 来 
查询 。 

如 果 能 确切 知道 内 层 查 询 返 回 的 是 单 值 ,IN 嵌 套 也 可 以 用 比较 运算 符 “ 王 ”代替 , 即 
例 11. 49 也 可 以 写成 : 

SELECT cno 


FROM Score 


WHERE sno = (SELECT sno FROM Student WHERE sname= ' 唐 晓 宇 '); 
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11.6.3 使 用 存在 量词 EXISTS 的 子 查询 


SQL 查询 提供 量词 运算 ,使 用 谓词 EXISTS 表示 。WHERE 子 句 中 的 谓词 EXISTS 
用 来 判断 其 后 的 子 查 询 的 结果 集合 中 是 否 存 在 元 素 , 谓 词 EXISTS 大 量 用 于 相关 子 查 
询 中 。 

【 例 11.53】 查询 学 生 唐 晓 宇 所 选修 的 课程 号 .课程 名 称 。 

该 查询 可 直接 通过 连接 运算 实现 ,也 可 以 通过 IN 子 查询 来 实现 。 还 可 以 通过 存在 
量词 实现 : 


SELECT cno, cname 
FROM Course 
WHERE EXISTS 
(SELECT * FROM Score, Student 
WHERE Score.sno=Student.sno 
AND Course.cno=Score.cno 
AND sname=' 唐 晓 宇 '); 


本 查询 涉及 Student、Score 和 Course 三 个 关系 ,属于 相关 子 查询 。 相 关子 查询 即 子 
查询 的 执行 依赖 于 外 查询 。 相 关子 查询 执行 过 程 是 先 外 查询 ,后 内 查询 ,然后 又 外 查询 ， 
再 内 查询 ,如 此 反复 ,直到 外 查询 处 理 完毕 。EXISTS 表示 存在 量词 ,用 来 测试 子 查询 是 
否 有 结果 ,如 果子 查询 的 结果 集中 非 空 (至 少 有 一 行 ), 则 EXISTS 条 件 为 TRUE ,和 否则 为 
FALSE。 具 体 查 询 过 程 如 下 。 

(1) 首先 取 Course 表 的 第 一 个 元 组 ,并 取 其 课 号 Course. cno。 

(2) 执行 子 查询 ,该 子 查询 对 表 Score 和 Student 进行 连接 ,并 选择 其 课 号 为 Course. 
cno, 其 学 生 姓名 为 “ 唐 晓 宇 ” 的 元 组 。 

(3) 如 果子 查询 中 可 以 得 到 结果 ( 即 存在 元 组 ) , 则 将 Course 表 中 该 元 组 的 课程 号 和 
课程 名 称 组 成 一 个 新 元 组 放 在 结果 集合 中 ;和 否则 ( 即 不 存在 元 组 ) ,直接 丢弃 该 元 组 。 

(4) 如 果 Course 表 中 还 有 元 组 , 则 取 Course 表 的 下 一 个 元 组 ,并 取 其 课 号 Course. 
cno, 转 第 (2) 步 ;否则 转 第 (5) 步 。 

(5) 将 结果 集合 中 的 元 组 作为 一 个 新 关系 输出 。 

从 上 面 的 查询 中 可 以 看 到 : 由 于 EXISTS 的 子 查 询 只 测试 子 查询 的 结果 集 是 否 为 
空 , 因 此 ,在 子 查 询 中 指定 列 名 是 没有 意义 的 。 所 以 在 有 EXISTS 的 子 查询 中 ,其 列 名 序 
列 通 常 都 用 * x ”表示 。 

【 例 11.54】 查询 选修 了 全 部 课程 的 学 生 姓名 。 

这 个 查询 可 以 求 这 样 的 学 生 : 没有 一 门 课 是 他 没 选修 的 (可 以 理解 为 : 否定 之 否定 )。 

SELECT sname 

FROM Student x 

WHERE NOT EXISTS 


(SELECT #* FROM Course C 
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WHERE NOT EXISTS “ -- 判 断 学 生 x.sno 没有 选修 课程 c.cno 
(SELECT * FROM Score 
WHERE sno=x.sno 


RND cno=c.cno)); 


11.7 集合 运算 


SQL 支持 集合 运算 ,SELECT 语句 查询 的 结果 是 集合 。 在 标准 SQL 中 ,集合 运算 的 
关键 字 分 别 为 UNION( 并 ) .INTERSECT( 交 ) .EXCEPT ( 差 )。 因 为 一 个 查询 的 结果 是 
一 个 表 , 可 以 看 作 是 行 的 集合 ,因此 ,可 以 利用 SQL 的 集合 运算 关键 字 , 将 两 个 或 两 个 以 
上 查询 结果 进行 集合 运算 ,这 种 查询 通常 称 为 组 合 查询 (也 称 为 集合 查询 )。 在 执行 集合 
运算 时 要 求 参 与 运算 的 查询 结果 的 列 数 一 样 ,其 对 应 列 的 数据 类 型 必须 一 致 。 


1. 将 两 个 查询 结果 进行 并 运算 


并 运算 使 用 UNION 运算 符 。 它 将 两 个 查询 结果 合并 ,并 消去 重复 行 而 产生 最 终 的 
一 个 结果 表 。 组 合 查询 最 终结 果 表 中 的 列 名 来 自 第 一 个 SELECT 语句 。 
【 例 11. 55】 查询 女生 的 学 生 信息 和 年 龄 大 于 20 的 学 生 信息 的 并 集 。 


SELECT * 

FROM Student 

WHERE sex=' 女 ' 

UNION 

SELECT * 

FROM Student 

WHERE year (getdate())-year(birthday)>=20; 


上 述 SQL 语句 也 可 以 改写 为 : 


SELECT * 
FROM Student 
WHERE sex=' 女 'OR Year (getdate () ) -Year (birthday)>=20; 


2. 将 两 个 查询 结果 进行 交 运 算 


交 运 算 符 是 INTERSECT, 它 将 同时 属于 两 个 查询 结果 表 的 行 作为 整个 查询 的 最 终 
【 例 11.56】 查询 女生 的 学 生 信息 和 年 龄 大 于 20 的 学 生 信 息 的 交集 。 


SELECT * 
FROM Student 
WHERE sex=' 女 ' 
INTERSECT 
SELECT * 
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FROM Student 
WHERE year (getdate())-year (birthday)>=20; 


上 述 SQL 语句 也 可 以 改写 为 : 


SELECT 关 
FROM Student 
WHERE sex=' 女 'AND year (getdate())-year (birthday)>=20; 


注意 : SQL Server 数据 库 不 支持 交 运 算 INTERSECT, 交 运算 完全 可 以 用 其 他 运算 


替代 。 


3. 将 两 个 查询 结果 进行 差 运算 
差 运算 符 是 MINUS 或 EXCEPT, 它 将 属于 第 一 个 查询 结果 表 而 不 属于 第 二 个 查询 


结果 表 的 行 组 成 最 终 的 结果 表 。 


【 例 11.57】 查询 女生 的 学 生 信息 和 年 龄 大 于 20 的 学 生 信息 的 差 集 。 


SELECT * 

FROM Student 

WHERE sex=' 女 ' 

EXCEPT 

SELECT * 

FROM Student 

WHERE year (getdate () )-Year (birthday)>=20; 


上 述 SQL 语句 也 可 以 改写 为 : 


SELECT * 
FROM Student 
WHERE sex=' 女 'AND sno NOT IN 
(SELECT sno 
FROM Student 
WHERE year (getdate ())-year(birthday)>=20); 


注意 ; SQL Server 数据 库 不 支持 差 运 算 EXCEPT, 差 运算 完全 可 以 用 其 他 运算 


替代 。 


ll: 


8 SQL 的 数据 操纵 


数据 表 创 建 之 后 ,就 可 以 对 表 执 行 各 种 操作 了 。 操 作 表 实际 上 就 是 操作 数据 。 用 户 


可 以 根据 需要 向 表 中 添加 数据 ,可 以 更 新 表 中 已 有 的 数据 ,甚至 可 以 删除 表 中 不 再 使 用 的 
数据 。SQL 数据 更 新 语句 包括 三 条 : 插入 INSERT 删除 DELETE 和 修改 UPDATE。 


11.8.1 插入 数据 
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条 记录 。 
1. 插入 一 个 元 组 


表 创 建 之 后 只 是 一 个 空 表 , 因 此 向 表 中 插入 数据 是 在 表 结构 创建 之 后 首先 需要 执行 
的 操作 。 向 表 中 插入 数据 ,应 该 使 用 INSERT 语句 。 该 语句 包括 两 个 子 句 , 即 INSERT 
子 句 和 VALUES 子 句 。INSERT 子 句 指定 要 插入 数据 的 表 名 或 视图 名 称 , 它 可 以 包含 
表 或 视图 中 列 的 列表 。VALUES 子 句 指定 将 要 插入 的 数据 。 

一 般 地 ,使 用 INSERT 语句 一 次 只 能 插入 一 行 数据 。INSERT 语句 的 基本 语法 格式 
如 下 。 


INSERT INTO <tableName>[ (<columnNamel> [, <columnName2>* ]) ] 


VALUES (<valuel> [，<Value2>…] ) 


完成 将 新 元 组 插入 到 指定 的 表 中 的 功能 。 其 中 : 

(1) 一 tableName>: 要 插入 记录 的 表 名 。 

(2) [一 columnNamel 二 [, 一 columnName2 二 … ]]: 指明 被 插入 的 元 组 按 元 组 
一 columnNamel 二 , 二 columnName2 之 ，… 指 定 的 属性 名 称 和 顺序 将 元 组 数据 插 到 表 
一 tableName 过 中 去 。 该 项 可 以 省 略 , 若 省 略 ,表示 必须 按照 二 tableName 之 表 的 属性 个 
数 和 属性 顺序 插入 新 元 组 。 

(3) [和 过 valuel 二 [, 过 value2 之 … ]]: 指明 被 插入 元 组 的 具体 属性 值 。 值 的 个 数 和 
顺序 必须 与 [过 columnNamel 二 [, 二 columnName2 二 …]] 相 对 应 ;对 于 二 tableName 二 
表 中 的 属性 没有 在 [一 columnNamel 二 [, 一 columnName2 二 …]] 中 出 现 的 属性 列 ,系统 
自动 取 空 值 。 

【 例 11.58】 将 一 个 新 学 生 元 组 (201825025', 呆 治 亿 ', 男 ', '2000-8-9', 南京 ,汉族 
"MP18020 插 人 到 学 生 表 Student 中 。 


INSERT INTO Student 
VALUES ("201825025'，' 宋 治 亿 '，' 男 ',，'2000- 8-9'，' 南 京 '，' 汉 族 '，'MP1802'); 
本 例 表 名 Student 后 没有 指定 列 名 ,表示 按照 Student 表 定 义 的 属性 列 的 个 数 和 顺 
序 将 新 元 组 插入 到 Student 表 中 。 
【 例 11. 59】 将 一 个 新 学 生 元 组 (姓名 : 张 瀚 文 ,出 生日 期 1999-10-12, 学 号 : 
201825026) 插 入 到 学 生 表 Student 中 。 


INSERT INTO Student (sname, birthday, sno) 

VALUES (' 张 瀚 文 ',，'1999-10-12','201825026' ); 

本 例 按 照 指 定 列 的 顺序 和 列 的 个 数 向 学 生 表 Student 插入 一 个 新 元 组 ,没有 列 出 的 
属性 列 自动 取 空 值 ;插入 新 元 组 时 ,数据 的 组 织 可 不 按照 表 结 构 定 义 的 属性 个 数 和 顺序 进 
行 插入 。 

在 插入 部 分 列 数 据 时 ,应 该 注意 下 面 两 个 问题 。 

(1) 在 INSERT 子 句 中 ,明确 指定 要 插入 数据 的 列 名 。 
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(2) 在 VALUES 子 句 中 , 列 出 与 列 名 对 应 的 数据 。 列 名 顺序 和 数据 顺序 应 该 完全 
对 应 。 


2. 插入 多 个 元 组 


虽然 使 用 INSERT 语句 一 次 只 能 插入 一 行 数据 ,但 是 如 果 在 INSERT 语句 中 包含 
SELECT 语句 ,那么 这 时 可 以 一 次 插入 多 行 数据 。INSERT 语句 插入 多 个 元 组 的 语法 格 
式 如 下 。 


INSERT INTO <tableName> [ (<columnNamel> [，<columnName2>… ]) ] 


<subquery> 


其 中 : 

(1) 一 tableName>: 要 插入 记录 的 表 名 。 

(2) [二 columnNamel 二 [, 二 columnName2 二 … ] ]: 指明 被 插入 的 元 组 按 
< 一 columnNamel 二 , 二 columnName2 之 ,，… 指 定 的 属性 名 称 和 顺序 插入 到 志 tableName 
中 ;该 项 可 以 省 略 , 若 省 略 则 其 查询 出 来 的 结果 必须 与 二 tableName 二 表 结 构 相 同 。 

(3) 二 subquery 二 : 由 SELECT 语句 引出 的 一 个 查询 。 

【 例 11.60】 建立 一 个 学 生 总 分 表 , 存 储 每 个 学 生 的 成 绩 总 分 。 

先 建立 一 张 表 来 保存 每 个 学 生 的 总 分 ,然后 对 Score 表 进行 查询 ,将 结果 放 入 表 中 。 


Create table StudentScore ( 
sno char (9), 
total decimal (3) ) 7 


然后 执行 如 下 语句 。 


Insert into StudentScore 
SELECT sno，sum(SsScore) 
FROM Score 

GROUP BY sno; 


在 使 用 INSERT…SELECT 形式 插入 数据 时 ,应 该 注意 下 面 几 点 。 

(1) 在 INSERT 语句 中 使 用 SELECT 时 ,引用 的 表 既 可 以 是 相同 的 ,也 可 以 是 不 相 
同 的 。 

(2) 要 插入 数据 的 表 必 须 已 经 存在 。 

(3) 要 插入 数据 的 表 必 须 和 SELECT 语句 的 结果 集 兼 容 。 兼 容 的 含义 是 列 的 数量 
和 顺序 必须 相同 、 列 的 数据 类 型 兼容 等 。 


11. 8.2 更 新 数据 
可 以 使 用 UPDATE 语句 更 新 表 中 已 经 存在 的 数据 。UPDATE 语句 既 可 以 一 次 更 


新 一 行 数据 ,也 可 以 一 次 更 新 许多 行 ,甚至 可 以 一 次 更 新 表 中 的 全 部 数据 行 。 
在 UPDATE 语句 中 ,使 用 WHERE 子 句 指定 要 更 新 的 数据 行 满足 的 基本 条 件 ,使 用 
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SET 子 句 给 出 新 的 数据 。 新 数据 既 可 以 是 常量 ,也 可 以 是 指定 的 表达 式 。 如 果 使 用 
UPDATE 语句 更 新 数据 时 ,数据 与 数据 类 型 等 约束 定义 有 冲突 ,那么 更 新 将 不 会 发 生 ， 
整个 更 新 事务 全 部 被 取消 。UPDATE 语句 的 基本 语法 格式 如 下 。 


UPDATE <tableName> 
SET <columnNamel>=<exprl> [, <columnName2>=<expr2>*… ] 
[FROM <tableNamel | queryNamel | viewNamel> [AS] [<aliasNamel>] 
[, <tableName2 | queryName2 | viewName2> [AS] [<aliasName2>] *…] 
[WHERE <predicate>] 


其 中 : 

(1) 过 tableName 之 : 要 进行 修改 记录 的 表 名 。 

(2) SET <columnNamel> = <exprl> [, <columnName?2> = <expr2> ]: 
用 表达 式 的 值 替代 属性 列 的 值 ,一 次 可 以 修改 元 组 的 多 个 属性 列 , 之 间 以 逗号 分 隔 。 

(3) [WHERE 一 predicate 二 ]: 指出 被 修改 的 记录 所 满足 的 条 件 ,该 项 可 以 省 略 , 若 
省 略 ,表示 修改 表 中 的 所 有 记录 ,WHERE 子 句 中 可 以 包含 子 查询 。 

【 例 11.61】 将 唐 晓 宇 同 学 选修 的 003 课程 的 成 绩 除 3 加 40 分 。 


UPDRTE Score 

SET score=score/3+40 

WHERE cno='003' AND sno IN ( 
SELECT sno FROM Student 
WHERE sname= ' 唐 晓 宇 ' ); 


也 可 以 写成 : 


UPDATE Score 

SET score=score/3+40 

FROM Score a, Student b 

WHERE cno= '005' AND a.sno=b.sno AND sname= ' 唐 晓 宇 '7 


【 例 11.62】 将 信息 管理 与 信息 系统 18_01 班 的 男 同学 的 成 绩 乘 以 0.9 分 。 


UPDATE Score 
SET score=score* 0.9 
FROM Score a, Student b, Classc 
WHERE a.sno=b.sno AND b.classNo=c.classNo 
AND className= ' 信 息 管理 与 信息 系统 18_01 班 ' RND sex=' 男 '; 


【 例 11.63】 将 学 号 为 201822001 同学 的 出 生日 期 修改 为 1999 年 12 月 6 日 ,籍贯 修 
改 为 上 海 。 
UPDATE Student 


SET birthday= '1999-12-6 '， native=' 上 海 " 
WHERE sno="201822001"'; 


注意 : 插入 、 删 除 和 修改 操作 会 破坏 数据 的 完整 性 ,如 果 违 反 了 完整 性 约束 条 件 ,其 
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操作 会 失败 。 
【 例 11.64】 将 每 个 班级 的 学 生 人 数 填 人 到 班级 表 的 classNum 列 中 。 


UPDRTE Class 

SET classNum= SCount 

FROM Class ay 
(SELECT classNo, count (#* ) sCount 
FROM Student 
GROUP BY classNo ) b 

WHERE a.classNo=b.classNo; 


11.8.3 删除 数据 


当 表 中 的 数据 不 再 需要 时 ,可 以 将 其 删除 。 一 般 情况 下 ,使 用 DELETE 语句 删除 数 
据 。DELETE 语句 可 以 从 一 个 表 中 删除 一 行 或 多 行 数据 。 
DELETE 语句 的 基本 语法 格式 如 下 。 


DELETE FROM <tableName> [WHERE <predicate>] 


其 中 : 

(1) 二 tableName 之 : 要 删除 记录 的 表 名 。 

(2) [WHERE 过 predicate 之 ]: 指出 被 删除 的 元 组 所 满足 的 条 件 ,该 项 可 以 省 略 , 若 
省 略 则 表示 删除 表 中 的 所 有 元 组 ,WHERE 子 句 中 可 以 包含 子 查询 。 

【 例 11.65】 删除 学 号 为 201822001 同学 的 选课 记录 。 


DELETE FROM Score 
WHERE sno= "201822001" 


【 例 11.66】 删除 选修 了 “数据 库 系统 原理 ”课程 的 选课 记录 。 


DELETE FROM Score 
WHERE cno IN (SELECT cno 
FROM Course 
WHERE cname= ' 数 据 库 系统 原理 '); 


【 例 11.67】 删除 平均 分 为 50 一 60 分 的 学 生 选 课 记 录 。 


DELETE FROM Score 
WHERE sno IN (SELECT sno 
FROM Score 
GROUP BY sno 
HAVING avg (score) BETWEEN 50 AND 60) 7 


和 UPDATE 语句 一 样 ,在 DELETE 语句 中 还 可 以 再 使 用 一 个 FROM 子 句 指定 将 
要 删除 的 数据 与 其 他 表 或 视图 之 间 的 关系 。 也 就 是 说 ,一 个 正常 的 DELETE 语句 中 可 以 
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包含 两 个 FROM 子 句 ,但 是 这 两 个 FROM 子 句 的 作用 是 不 同 的 。 第 一 个 FROM 子 句 用 
于 指定 将 要 删除 的 数据 所 在 的 表 或 视图 名 称 ,第 二 个 FROM 子 句 用 于 指定 将 要 删除 的 数 
据 的 其 他 复杂 条 件 。 


11.9 视图 


视图 是 虚 表 ,是 从 一 个 或 几 个 基本 表 ( 或 视图 ) 中 导出 的 表 , 其 结构 和 数据 是 建立 在 对 
表 的 查询 基础 上 的 。 视 图 与 基本 表 一 样 包含 一 系列 带 有 名 称 的 列 和 行 数 据 。 但 是 ,视图 
没有 存储 任何 数据 ,不 占 物 理 存储 空间 , 行 和 列 的 数据 来 自 定义 视图 的 查询 所 引用 的 基本 
表 , 并 且 在 生成 视图 时 动态 生成 。 和 真实 的 表 一 样 ,视图 也 包括 几 个 被 定义 的 数据 列 和 多 
个 数据 行 ,但 从 本 质 上 讲 , 这 些 数据 列 和 数据 行 来 源 于 它 所 引用 的 表 。 因 此 ,视图 不 是 真 
实 存在 的 基础 表 , 而 是 一 个 虚拟 表 , 视 图 中 所 显示 的 数据 并 不 以 视图 结构 存储 在 数据 库 
中 ,而 是 存储 在 视图 所 引用 的 表 中 。 在 系统 的 数据 字典 中 仅 存 放 视 图 的 定义 ,不 存放 视图 
对 应 的 数据 。 当 基本 表 中 的 数据 发 生变 化 时 ,从 视图 中 查询 出 的 数据 也 随 之 改变 。 

视图 实现 了 数据 库 管理 系统 三 级 模式 中 的 外 模式 。 基 于 视图 的 操作 包括 : 查询 、 删 
除 , 受 限 更 新 和 定义 基于 该 视图 的 新 视图 。 视 图 的 优点 主要 表现 在 以 下 方面 。 

(1) 数据 集中 显示 。 视 图 使 用 户 着 重 于 其 感 兴趣 的 某 些 特定 数据 和 其 所 负责 的 特定 
任务 ,适当 地 利用 视图 可 以 更 清晰 地 表达 查询 ,可 以 提高 数据 操作 效率 。 

(2) 简化 对 数据 的 操作 。 视 图 可 以 大 大 简化 用 户 对 数据 的 操作 。 可 以 将 经 常 使 用 的 
连接 投影、 联合 查询 或 选择 查询 定义 为 视图 ,这 样 在 每 次 执行 相同 的 查询 时 ,不 必 重 新 写 
这 些 复 杂 的 查询 语句 ,只 要 一 条 简单 的 查询 视图 语句 即 可 。 但 视图 向 用 户 隐藏 了 表 与 表 
之 间 的 复杂 的 连接 操作 。 

(3) 使 用 户 能 以 多 种 角度 看 待 同一 数据 。 视 图 能 够 让 不 同 的 用 户 以 不 同 的 方式 看 到 
不 同 或 相同 的 数据 集 , 即 使 不 同 水 平 的 用 户 共用 同一 数据 库 时 也 是 如 此 。 

(4) 对 重 构 数据 库 提供 了 一 定 程 度 的 逻辑 独立 性 。 在 某 些 情况 下 ,由 于 表 中 数据 量 
太 大 ,在 表 的 设计 过 程 中 ,可 能 需要 经 常 将 表 进 行 水 平分 割 或 垂直 分 割 , 然 而 表 的 结构 的 
变化 会 对 应 用 程序 产生 不 良 的 影响 。 使 用 视图 可 以 重新 保持 原 有 的 结构 关系 ,使 得 外 模 
式 保持 不 变 , 原 有 的 应 用 程序 仍 可 以 通过 视图 重 载 数据 。 

(5) 能 够 对 机 密 数 据 提供 安全 保护 。 视 图 可 以 被 视 作 一 种 安全 机 制 。 数 据 库 所 有 者 
可 以 把 视图 的 权限 授予 需要 查询 的 用 户 ,而 不 必 将 基本 表 中 某 些 列 的 查询 权限 授予 用 户 。 
这 样 ,就 能 保护 修改 基本 表 的 设计 ,而 用 户 可 以 连续 查询 视图 ,而 不 被 影响 。 通 过 视图 ,用 
户 只 能 查看 和 修改 自己 能 看 到 的 数据 ,其 他 数据 或 表 既 不 可 见 也 不 可 访问 。 视 图 所 引用 
表 的 访问 权限 与 视图 权限 的 设置 互 不 影响 。 


11.9.1 创建 视图 


使 用 视图 前 必须 首先 创建 视图 ,其 语法 为 : 


CREATE VIEW <viewName> [<columnNamel>, <columnName2>, *… ] 
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AS <subquery> 
[WITH CHECK OPTION] 


其 中 : 

(1) 过 viewName>: 新 建 视 图 的 名 称 , 该 名 称 在 数据 库 中 唯一 。 

(2) [一 columnNamel 二 , 二 columnName2 之 ,，…]: 视图 定义 的 列 名 。 列 名 可 以 省 
略 , 列 名 自动 取 查询 出 来 的 列 名 ,但 是 属于 下 列 三 种 情况 时 必须 写 列 名 : 某 个 目标 列 是 聚 
集 函 数 或 表达 式 ; 多 表 连 接 中 有 相同 的 列 名 ;在 视图 中 为 某 列 取 新 的 名 称 更 合适 。 

(3) AS 一 subquery 之 : 子 查询 不 允许 含有 ORDER BY 子 句 和 DISTINCT 短语 。 

(4) [WITH CHECK OPTION]: 当 对 视图 进行 插入 删除 和 更 新 操作 时 必须 满足 
视图 定义 的 谓词 条 件 ( 子 查询 中 的 条 件 表达 式 ) 。 

数据 库 执行 CREATE VIEW 语句 时 只 把 视图 定义 存 人 数据 字典 中 ,并 不 执行 其 中 
的 SELECT 语句 。 

【 例 11.68】 创建 仅 包含 1999 年 出 生 的 学 生 视图 StudentView1999。 


CREATE VIEW StudentView1999 
RS 
SELECT * 
FROM Student 
WHERE year (birthday)=1999; 


本 例 省 略 了 视图 的 列 名 , 自动 取 查 询 出 来 的 列 名 。 由 于 本 例 没有 使 用 WITH 
CHECK OPTION 选项 ,下 面 的 语句 可 以 执行 。 
INSERT INTO StudentView1999 VALUES 
( '201825025'，' 宋 治 亿 '，' 男 '，'2000- 8-9'，' 南 京 '，' 汉 族 '，'MP1802') 
但 是 ,对 视图 StudentView1999 的 查询 不 能 查询 出 刚刚 插入 的 记录 。 
【 例 11.69】 创建 仅 包 含 1999 年 出 生 的 学 生 视图 StudentView1999Chk, 并 要 求 进 
行 修改 和 插入 操作 时 仍 需 保证 该 视图 只 有 1999 年 出 生 的 学 生 。 


CREATE VIEW StudentView1999Chk 
RS 
SELECT * 
FROM Student 
WHERE year (birthday)=1999 
WITH CHECK OPTION; 


本 例 建立 的 视图 StudentView1999Chk ,其 更 新 操作 必须 满足 以 下 条 件 。 

(1) 修改 操作 : 自动 加 上 year(birthday) 王 1999 的 条 件 。 

(2) 删除 操作 : 自动 加 上 year(birthday) 二 1999 的 条 件 。 

(3) 插入 操作 : 自动 检查 birthday 属性 值 是 否 满足 为 1999 年 出 生 , 如 果 不 是 , 则 拒 
绝 该 插入 操作 。 

本 例 使 用 了 WITH CHECK OPTION 选项 ,下 面 的 插入 语句 可 以 执行 。 
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INSERT INTO StudentView1991Chk VALUES 
( "201825025'，' 宋 治 亿 '，' 男 '，'1999- 8-9'，' 南 京 '，' 汉 族 '，'MP1802' 


而 下 面 的 插入 语句 不 可 以 执行 。 


INSERT INTO StudentView1991Chk VALUES 
( "201825025'，' 宋 治 亿 '，' 男 '，'2000- 8- 9'，' 南 京 '，' 汉 族 '，'MP1802' 
原因 是 插入 的 出 生日 期 违反 了 出 生日 期 必须 为 1999 年 。 
当 视 图 是 基于 一 张 表 , 且 保留 了 主 码 属性 ,这 样 的 视图 称 为 行列 子 集 视图 。 视 图 可 以 
建立 在 一 张 表 上 ,也 可 以 建立 在 多 张 表 上 。 
【 例 11.70】 创建 一 个 包含 学 生 学 号 、 姓 名、 课程 名 、 获 得 的 学 分 和 相应 成 绩 的 视图 
ScoreView。 


由 于 成 绩 必须 大 于 等 于 60 分 才 获 得 学 分 ,该 视图 必须 含有 该 条 件 。 


CREATE VIEW ScoreView 

RS 
SELECT a.sno, sname, cname, creditHour, score 
FROM Student a, Course b, Scorec 
WHERE a.sno=c.sno AND b.cno=c.cno 


AND score>=60; 
在 SQL Server 中 创建 视图 时 需要 遵循 下 列 规则 。 


(1) 只 能 在 当前 数据 库 中 创建 视图 。 
(2) 如 果 视 图 引用 的 基本 表 或 者 视图 被 删除 , 则 该 视图 不 能 再 被 使 用 ,直到 创建 新 的 


基本 表 或 者 视图 。 
(3) 如 果 视 图 中 某 一 列 是 函数 .数学 表达 式 、 常 量 或 者 来 自 多 个 表 的 列 名 相同 , 则 必 
须 为 列 定 义 名 称 。 


(4) 不 能 在 视图 上 创建 索引 ,不 能 在 规则 、 默 认 、 触 发 器 的 定义 中 引用 视图 。 

(5) 当 通 过 视图 查询 数据 时 ,SQL Server 要 检查 以 确保 语句 中 涉及 的 所 有 数据 库 对 
象 存在 ,而 且 数 据 修改 语句 不 能 违反 数据 完整 性 规则 。 

视图 的 名 称 必须 遵循 标识 符 的 规则 , 且 对 每 个 用 户 必须 是 唯一 的 。 此 外 ,该 名 称 不 得 
与 该 用 户 拥有 的 任何 表 的 名 称 相同 。 


11.9.2 查询 视图 


查询 是 对 视图 进行 的 最 主要 的 操作 。 从 用 户 的 角度 来 看 ,查询 视图 与 查询 基本 表 的 
方式 是 完全 一 样 的 。 从 系统 的 角度 来 看 ,查询 视图 的 过 程 如 下 。 

(1) 进行 有 效 性 检查 ,检查 查询 中 涉及 的 表 和 视图 是 否 存 在 。 

(2) 从 数据 字典 中 取出 视图 的 定义 ,将 视图 定义 的 子 查 询 与 用 户 的 查询 结合 起 来 , 转 
换 成 等 价 的 对 基本 表 的 查询 。 

(3) 执行 改写 后 的 查询 。 
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【 例 11.71】 在 StudentView1999 中 查询 CS1801 班 同学 的 信息 。 


SELECT * 
FROM StudentView1999 
WHERE classNo="'CS1801'; 


对 于 该 查询 ,系统 首先 进行 有 效 性 检查 ,判断 视图 StudentView1999 是 否 存 在 ,如 果 
存在 , 则 从 系统 的 数据 字典 中 取出 该 视图 的 定义 ,将 定义 中 的 子 查询 与 用 户 的 查询 结合 
来 ,转换 为 基于 表 的 查询 ,即将 视图 StudentView1999 的 定义 转换 为 : 


SELECT 关 
FROM Student 
WHERE year (birthday)=1999 AND classNo="'CS1801"' 


然后 系统 执行 改写 后 的 查询 。 这 个 把 对 视图 的 查询 转换 为 对 基本 表 的 查询 的 过 程 称 
为 视图 的 消解 (View Resolution) 。 


11.9.3 视图 更 新 


视图 更 新 指 通过 视图 来 插入 、 删 除 和 修改 基本 表 中 的 数据 。 由 于 视图 是 一 个 虚 表 ,不 
实际 存放 数据 ,对 视图 的 更 新 ,最 终 要 转换 为 对 基本 表 的 更 新 。 因 此 ,如 果 视 图 的 定义 中 
包含 表达 式 ,或 聚合 运算 ,或 消除 重复 值 运算 , 则 不 能 对 视图 进行 更 新 操作 。 

对 视图 进行 更 新 操作 ,其 限制 条 件 比 较 多 ,建立 视图 的 作用 不 是 利用 视图 来 更 新 数据 
库 中 的 数据 ,而 是 简化 用 户 的 查询 ,以 及 达到 一 定 程度 的 安全 性 保护 ,因此 尽量 不 要 对 视 
图 执行 更 新 操作 。 

【 例 11.72】 在 StudentView1999 中 ,将 学 号 为 201822002 的 学 生 的 名 字 修 改 为 “ 唐 
大 字 ”。 
UPDATE StudentView1999 


SET sname= ' 唐 大 宇 ' 
WHERE sno="201822002'; 


对 于 该 操作 ,系统 首先 进行 有 效 性 检查 ,判断 视图 StudentView1999 是 否 存在 ,如 果 
存在 , 则 从 系统 的 数据 字典 中 取出 该 视图 的 定义 ,将 定义 中 的 子 查 询 与 用 户 查询 相 结 合 ， 
转换 为 对 基本 表 的 修改 。 

UPDATE Student 

SET sname=' 唐 大 宇 ' 

WHERE year (birthday)=1999 AND sno="'201822002'; 

【 例 11.73】 在 视图 StudentView1999 中 将 学 号 为 201822003 的 学 生 的 出 生年 份 由 
1999 年 修改 为 2000 年 。 


UPDATE StudentView1999 
SET birthday= "2000-05-20" 
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WHERE sno="201822003"' 


注意 : 在 视图 StudentView1999Chk 中 不 能 将 出 生年 份 修改 为 2000 年 ,因为 该 视图 
对 修改 操作 进行 了 检查 。 
【 例 11.74】 在 视图 StudentView1999 中 将 学 号 为 201825013 的 同学 记录 删除 。 


DELETE FROM StudentView1999 
WHERE sno="201825013" 


系统 将 该 操作 转换 为 如 下 的 操作 。 


DELETE FROM Student 
WHERE year (birthday)=1999 AND sno="'201825013"'; 


更 新 视图 中 的 数据 实际 上 是 对 数据 表 的 数据 进行 更 新 。 事 实 上 , 当 从 视图 中 插入 
或 者 删除 数据 时 ,情况 也 相同 。 然 而 , 某 些 视图 是 不 能 更 新 数据 的 ,这 些 视图 具有 如 下 

(1) 有 UNION 等 集合 操作 符 的 视图 。 

(2) 有 GROUP BY 子 句 的 视图 。 

(3) 有 诸如 AVG、SUM 或 者 MAX 等 函数 的 视图 。 

(4) 使 用 DISTINCT 短语 的 视图 。 

(5) 连接 表 的 视图 (其 中 有 一 些 例外 ) 。 

通过 视图 可 以 修改 数据 ,但 是 无 论 在 什么 时 候 修改 视图 中 的 数据 ,实际 上 都 是 在 修改 
视图 的 基本 表 中 的 数据 。 在 满足 一 定 的 限制 条 件 下 ,可 以 通过 视图 自由 地 插入 、 删 除 和 更 
新 基本 表 中 的 数据 。 

在 修改 视图 时 ,要 注意 下 列 一 些 条 件 。 

(1) 不 能 同时 影响 两 个 或 两 个 以 上 的 基本 表 。 可 以 修改 由 两 个 或 两 个 以 上 的 基本 表 
得 到 的 视图 ,但 是 每 一 次 修改 的 数据 只 能 影响 一 个 基本 表 。 

(2) 某 些 列 不 能 修改 。 这 些 不 能 修改 的 列 包括 通过 计算 得 到 值 的 列 、 有 内 置 函数 的 
列 或 有 合计 函数 的 列 等 。 

(3) 如 果 影 响 到 表 中 那些 没有 默认 值 的 列 , 那 么 可 能 会 引起 错误 。 例 如 ,如 果 使 用 
INSERT 语句 向 视图 中 插入 数据 ,该 视图 的 基本 表 有 一 个 没有 默认 值 的 列 或 有 一 个 不 允 
许 空 的 列 , 且 该 列 没有 出 现在 视图 的 定义 中 ,那么 就 会 产生 一 个 错误 消息 。 

(4) 如 果 在 视图 定义 中 指定 了 WITH CHECK OPTION 选项 ,那么 系统 将 验证 所 修 
改 的 数据 。 WITH CHECK OPTION 选项 强制 对 视图 的 所 有 修改 语句 必须 满足 定义 视 
图 使 用 的 SELECT 语句 的 标准 。 如 果 这 种 修改 超出 了 视图 定义 的 范围 ,那么 系统 将 拒绝 
这 种 修改 。 


11.9.4 删除 视图 


有 相关 权限 的 用 户 , 可 以 将 已 经 存在 的 视图 删除 。 删 除 视 图 后 , 表 和 视图 所 基于 的 数 
据 不 受到 影响 。 删 除 视图 的 语法 格式 如 下 。 
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DROP VIEW <viewName> [CASCADE] 


其 中 ,CASCADE 为 可 选项 ,选择 表示 级 联 删除 。 

该 语句 从 数据 字典 中 删除 指定 的 视图 定义 ,如 果 该 视图 上 还 导出 了 其 他 视图 ,使 用 
CASCADE 级 联 删除 语句 ,把 该 视图 和 由 它 导 出 的 所 有 视图 一 起 删除 ;删除 基本 表 时 ,由 
该 基本 表 导 出 的 所 有 视图 定义 都 必须 显 式 地 使 用 DROP VIEW 语句 删除 。 

【 例 11.75】 删除 视图 ScoreView。 


DROP VIEW ScoreView; 
小 结 


本 章 主 要 介绍 了 目前 应 用 最 为 广泛 的 、 结 构 化 的 SQL 的 用 法 。SQL 具有 功能 丰富 、 
使 用 方法 灵活 .语言 简洁 等 优点 。 主 要 从 以 下 几 个 方面 介绍 了 SQL 的 功能 。 

(1) 数据 表 的 创建 ,修改 、 删 除 等 操作 。 修 改 数据 表 的 结构 ,包括 添加 修改 及 删除 某 
些 字段 。 

(2) SELECT 语句 的 语法 结构 ,给 出 了 SELECT 语句 所 包含 的 子 句 及 其 使 用 格式 。 

(3) 单 表 查 询 : 选择 列 满足 条 件 .排序 .查询 表 。 

(4) 连接 查询 : 常见 的 连接 类 型 ,从 内 连接 .外 连接 ,等 值 连接 和 自身 连接 几 方 面 进 
行 介绍 。 

(5) SQL 聚合 查询 : 使 用 聚合 函数 结合 GROUP BY 子 句 进行 统计 和 计算 。 

(6) 子 查询 (或 嵌 套 查询 ): 一 个 SELECT 查询 语句 典 套 在 SELECT INSERT、 
UPDATE DELETE 语句 或 其 他 子 查询 语句 中 。 

(7) 集合 理论 ,可 以 实现 查询 结果 的 并 、 交 和 差 运 算 。 

(8) SQL 的 数据 操纵 ,包括 INSERT、DELETE 和 UPDATE 语句 。 

(9) 视图 提供 了 查看 和 存 取 数据 的 另 一 种 途径 ,使 用 视图 不 仅 可 以 简化 查询 操作 ,还 
可 以 提高 数据 库 的 安全 性 ;不 仅 可 以 检索 数据 ,也 可 以 通过 视图 查看 ,修改 数据 。 

(10) 索引 和 数据 表 一 样 ,是 一 种 重要 的 数据 库 对 象 ,可 以 提高 访问 表 中 数据 的 速度 ， 
而 且 能 够 强制 实施 某 些 数 据 完整 性 。 


习题 
建立 一 个 图 书 管理 数据 库 。 图 书 管 理 数据 库 中 包括 4 个 表 : 图 书 分 类 表 、 图 书 表 . 读 
者 表 、 借 阅 表 。4 个 表 的 结构 如 表 11. 13 一 表 11. 16 所 示 。 
表 11.13 图 书 分 类 表 BookClass 结构 
属性 含义 属 性 名 数据 类 型 约 ” 束 


分 类 号 classNo 字符 型 ,长 度 为 3 非 主键 
分 类 名 称 className 字符 型 ,长 度 为 20 非 空 值 
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表 11.14 图 书 表 Book 结构 


属性 含义 属 性 名 数据 类 型 约 东 
图 书号 bookNo 字符 型 ,长 度 为 10 主键 
分 类 号 classNo 字符 型 ,长 度 为 3 非 空 值 
图 书 名 称 bookName 字符 型 ,长 度 为 40 非 空 值 
作者 authorName 字符 型 ,长 度 为 8 非 空 值 
出 版 社 publishing Name 字符 型 ,长 度 为 20 非 空 值 
单价 price 数值 型 非 空 什 
入 库 时 间 shopDate 日 期 型 空 值 
入 库 数 量 shopNum 数值 型 非 空 值 


表 11.15 读者 表 Reader 结构 


属性 含义 属 性 名 数据 类 型 约 束 
读者 号 readerNo 字符 型 ,长 度 为 8 主键 
姓名 readerName 字符 型 ,长 度 为 8 非 空 值 
性 别 sex 字符 型 ,长 度 为 2 非 空 值 
身份 证 号 identitycard 字符 型 ,长 度 为 18 非 空 值 
工作 单位 workUnit 字符 型 ,长 度 为 50 空 值 


表 11.16 借阅 表 Borrow 结构 


属性 含义 属 性 名 数据 类 型 约 东 
读者 号 readerNo 字符 型 ,长 度 为 8 外 键 ,引用 读者 表 的 主键 
图 书号 bookNo 字符 型 ,长 度 为 10 外 键 ,引用 图 书 表 的 主键 
借 出 日 期 borrowDate 日 期 型 非 空 值 

应 归还 时 间 shouldDate 日 期 型 空 值 

归还 日 其 returnDate 日 期 型 空 值 


主键 为 : (读者 号 , 图 书号 ) 


插入 如 表 11.17 一 表 11. 20 所 示 的 记录 。 
表 11.17 图 书 分 类 表 BookClass 中 的 记录 


分 类 号 分 类 名称 分 类 号 分 类 名 称 
001 文学 类 003 计算 机 类 
002 经 济 管理 004 数理 科学 类 
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表 11.18 图 书 表 Book 中 的 记录 


图 书号 | 分 类 号 | 图 书 名 称 作者 | 出 版 社 | 单价 | 入 库 时 间 | 多 
001-000001| 003 | 数据 库 系统 概念 萨 师 灶 | 清华 大 学 出 版 社 |28 ”|2010/10/10 | 500 
001-000002 | 003 | 数据 库 系统 原理 与 设计 | 万 常 选 | 清华 大 学 出 版 社 |35 |2017/12/12 | 400 
001-000006 | 003 |C 语言 程序 开发 吴 文 君 | 电子 工业 出 版 社 |44 “|2017/11/11 | 400 
001-000007 | 003 |C 语言 程序 设计 吴 文 君 | 机 械 工业 出 版 社 | 55 |2017/10/10 | 500 
001-000011| 002 | 经 济 管理 学 朱江 “| 电子 工业 出 版 社 | 49.5 | 2015/3/3 1000 
001-000012| 002 | 经 济 管理 概论 李 大 海 | 石油 工业 出 版 社 | 36.3 | 2017/9/9 200 
001-000029 | 001 | 美丽 日 记 方 雪 梅 | 文艺 出 版 社 80 |2017/4/4 70 
002-000008| 004 | 高 等 数学 吴 建 成 | 高 等 教育 出 版 社 |20 |2016/1/1 5000 
002-000009| 004 | 离散 数学 李 大 友 | 高 等 教育 出 版 社 |18 |2016/6/6 3000 

表 11.19 读者 表 Reader 中 的 记录 

读者 号 姓名 性 别 身份 证 号 工作 单位 

00000001 王 疯 男 210211199903032563 信息 管理 学 院 

00000002 李 驹 勇 男 210210199905294589 信息 管理 学 院 

00000003 董 晓 阳 女 320203199912125689 信息 管理 学 院 

00000004 董 大 海 男 560529199907089852 信息 管理 学 院 

00000005 罗 伯 伯 男 394839200005054890 会 计 学 院 

00000006 黎明 名 女 506050200004049808 会 计 学 院 

00000007 马 永 强 男 560965199808082563 电子 工程 学 院 

00000012 李楠 卖 459125199804045896 会 计 学 院 

表 11.20 借阅 表 Borrow 中 的 记录 
读者 号 书号 借 出 日 期 应 还 日 期 归还 时 间 

00000001 001-000001 2018/1/1 2018/4/1 2018/3/4 

00000001 001-000006 2017/6/9 2017/9/9 2017/8/9 

00000001 001-000011 2017/5/5 2017/8/5 2017/7/5 

00000001 001-000012 2017/5/5 2017/8/5 2017/7/5 

00000001 001-000029 2018/6/6 2018/9/6 

00000001 002-000008 2016/8/8 2016/11/8 2016/10/9 

00000001 002-000009 2017/5/5 2017/8/5 2017/7/20 

00000004 001-000011 2018/5/5 2018/8/5 2018/7/5 
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续 表 

读者 号 书号 借 出 日 期 应 还 日 期 归还 时 间 
00000004 001-000012 2018/5/5 2018/8/5 2018/7/5 
00000004 002-000009 2018/10/10 2019/1/10 
00000005 002-000009 2017/10/10 2018/1/10 
00000006 001-000011 2018/5/5 2018/8/5 2018/7/5 
00000006 002-000009 2017/10/10 2018/1/10 
00000007 001-000001 2017/10/10 2018/1/10 2017/12/12 
00000007 001-000006 2018/5/5 2018/8/5 2018/6/6 
00000007 001-000012 2017/5/5 2017/8/5 2017/7/5 
00000007 001-000029 2018/9/9 2018/11/9 2018/10/10 
00000007 002-000008 2017/8/8 2017/11/8 2017/10/9 
00000007 002-000009 2018/10/10 2019/1/10 


请 基于 上 述 结构 用 SQL 语句 完成 如 下 操作 。 

11.1 显示 所 有 借阅 者 的 读者 号 ,并 去 掉 重 复 行 。 

11.2 查询 全 体 图 书 的 信息 ,其 中 单价 打 8 折 , 并 且 将 该 列 设置 别名 为 打折 价 ”。 
11.3 查询 所 有 单价 不 在 20 一 30 元 的 图 书信 息 。 

11.4 查询 清华 大 学 出 版 社 . 电 子 工业 出 版 社 ` 机 械 工业 出 版 社 的 图 书信 息 。 

11.5 查询 既 不 是 清华 大 学 出 版 社 , 也 不 是 机 械 工业 出 版 社 的 图 书信 息 。 

11.6 查询 1999 年 出 生 的 读者 姓名 工作 单位 和 身份 证 号 。 

11.7 查询 图 书 名 中 含有 “数据 库 ” 的 图 书 的 详细 信息 。 

11.8 ”查找 姓名 的 第 二 个 字符 是 “大 ”并 且 只 有 三 个 字符 的 读者 的 读者 号 、 姓 名 。 
11.9 查询“ 吴 文 君 " 老 师 编 写 的 单价 不 低 于 40 元 的 每 种 图 书 的 图 书 编号 .人 库 


11.10 查询 2016 一 2017 年 人 库 的 图 书 编号 、 入 库 时 间 和 图 书 名 称 , 并 按 入 库 时 间 排 


11.11 查询 借阅 了 “002-000008” 图 书 编号 的 读者 姓名 、 借 书 日 期 还 书 日 期 。 

11.12 查询 读者 * 董 大 海 ”借阅 的 图 书 编号 .图书 名 称 、 借 书 日 期 和 归还 日 期 。 

11.13 查询 电子 工程 学 院 没 有 归还 图 书 的 读者 编号 .读者 名 称 .图 书 名 称 、 借 书 日 期 
和 应 归还 日 期 。 

11.14 查询 借阅 了 清华 大 学 出 版 社 出 版 的 图 书 的 读者 编号 .读者 名 称 、 图 书 名 称 、 借 
书 日 期 和 归还 日 期 。 

11.15 查询 借 书 时 间 2016 一 2017 年 的 读者 编号 .读者 名 称 .图书 编 号 .图 书 名 称 。 

11.16 查询 借阅 了 图 书 编号 为 “002-000009?” 图 书 的 读者 编号 .读者 姓名 以 及 他 们 所 
借阅 尚未 归还 的 所 有 图 书 的 图 书 名 称 、 借 书 日 期 。 
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11.17 查询 2016 一 2017 年 借阅 但 没有 归还 图 书 的 读者 编号 ,读者 姓名 、 读 者 工作 单 
位 以 及 他 们 所 借阅 过 的 所 有 图 书 的 图 书 编号 、 图 书 名 称 和 借 书 日 期 。 


i 
[1 交 


LZ 
ld. 


Un 


“18 
“19 


查询 清华 大 学 出 版 社 图书 的 平均 价格 、 最 高 价 、 最 低 价 。 
查询 每 种 类 别 的 图 书 分 类 号 、 最 高 价格 和 平均 价格 ,并 按 最 高 价格 的 降序 


查询 借阅 图 书本 数 超过 两 本 的 读者 号 ,总 本 数 ,并 按 借 阅 本 数值 从 大 到 小 


查询 所 借 图 书 总 价 在 180 元 以 上 的 读者 编号 .读者 名 称 和 所 借 图 书 的 总 价 。 
查询 正在 借阅 的 图 书信 息 。 

查询 没有 借 书 的 读者 姓名 工作 单位 。 

将 “文学 类 ”图 书 的 单价 提高 10%。 

对 于 年 龄 18 一 19 岁 的 读者 所 借阅 的 应 归还 未 归还 的 图 书 ,将 其 归还 日 期 修 


改 为 系统 当天 日 期 。 
11.26 将 入 库 数量 最 多 的 图 书 单价 下 调 5%。 
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第 12 章 ”数据库 设计 及 优化 


本 章 学 习 目 标 
。 理解 数据 库 系 统 设 计 的 方法 。 
。 理解 需求 分 析 的 任务 和 方法 。 
。 掌握 概念 结构 设计 的 方法 和 步骤 。 
。 掌握 逻辑 结构 设计 的 方法 。 
。 掌握 规范 化 理论 。 
。 了 解数 据 库 的 物理 设计 。 


随 着 计算 机 技术 的 广泛 应 用 ,目前 从 小 型 的 单项 事务 处 理 到 大 型 的 信息 系统 都 采用 
数据 库 技术 来 保持 数据 的 完整 性 和 一 致 性 ,因此 在 应 用 系统 的 设计 中 ,数据 库 设计 得 是 否 
合理 变 得 日 趋 重 要 。 具 体 地 说 ,数据 库 设 计 是 指针 对 一 个 给 定 的 应 用 环境 ,构造 最 优 的 数 
据 库 模式 ,建立 数据 库 及 其 应 用 系统 ,使 之 能 够 有 效 地 存储 数据 ,满足 各 种 用 户 的 应 用 需 
求 。 数 据 库 设计 是 数据 库 在 应 用 领域 的 主要 研究 课题 。 目 前 我 们 所 说 的 数据 库 设计 ,大 
多 是 在 一 个 现成 的 DBMS 的 支持 下 进行 的 , 即 一 个 以 通用 的 DBMS 为 基础 开发 的 数据 库 
应 用 系统 。 本 章 将 围绕 着 数据 库 系统 设计 的 6 个 基本 步骤 ,介绍 如 何 从 最 初 的 需求 分 析 
到 完成 数据 库 设计 整个 过 程 相关 的 知识 。 


12.1 数据 库 设计 方法 


数据 库 设计 (Database Design) 是 指 根据 应 用 需求 和 软 、 硬 件 环境 的 约束 ,构造 最 优 的 
数据 库 概 念 模型 逻辑 模型 (模式 和 外 模式 ) ,物理 模型 ,建立 数据 库 及 其 应 用 系统 ,使 之 能 
够 有 效 地 存储 数据 ,满足 各 种 用 户 的 应 用 需求 (信息 要 求 和 处 理 要 求 ) 。 


12.1.1 数据 库 和 信息 系统 


在 数据 库 领 域内 ,常常 把 使 用 数据 库 的 各 类 系统 统称 为 数据 库 应 用 系统 。 数 据 库 与 
信息 系统 的 关系 如 下 。 

(1) 数据 库 是 信息 系统 的 核心 和 基础 ,把 信息 系统 中 大 量 的 数据 按 一 定 的 模型 组 织 
起 来 ,提供 存储 、 维 护 、 检 索 数据 的 功能 ,使 信息 系统 可 以 方便 、 及 时 准确 地 从 数据 库 中 获 
得 所 需 的 信息 。 

(2) 数据 库 是 信息 系统 的 各 个 部 分 能 否 紧 密 地 结合 在 一 起 以 及 如 何 结合 的 关键 
所 在 。 


数据 结构 与 数据 库 应 用 教程 


(3) 数据 库 设 计 是 信息 系统 开发 和 建设 的 重要 组 成 部 分 。 

数据 库 设计 人 员 应 该 具备 的 技术 和 知识 如 下 。 

(1) 数据 库 的 基本 知识 和 数据 库 设 计 技 术 。 

(2) 计算 机 科学 的 基础 知识 和 程序 设计 的 方法 与 技巧 。 

(3) 软件 工程 的 原理 和 方法 。 

(4) 应 用 领域 的 知识 。 

在 设计 过 程 中 应 把 数据 库 的 设计 和 对 数据 库 中 数据 处 理 的 设计 紧密 结合 起 来 ,将 这 
两 个 方面 的 需求 分 析 、 抽 象 \ 设 计 、 实 现在 各 个 阶段 同时 进行 ,相互 参照 ,相互 补充 ,以 完善 
两 方面 的 设计 。 


12.1.2 数据 库 设计 过 程 


数据 库 设计 就 是 根据 各 种 应 用 处 理 的 要 求 .硬件 环境 及 操作 系统 的 特性 等 ,将 现实 世 
界 中 的 数据 进行 合理 组 织 , 并 利用 已 有 的 数据 库 管理 系统 (DBMS) 来 建立 数据 库 系统 的 
过 程 。 具 体 地 说 , 即 对 于 一 个 给 定 的 应 用 环境 ,构造 出 最 优 的 数据 库 逻 辑 模式 和 物理 模 
式 ,并 建立 数据 库 及 其 应 用 系统 ,使 之 能 够 有 效 地 存储 和 管理 数据 ,满足 用 户 的 信息 要 求 
和 处 理 要 求 。 

目前 ,数据 库 设计 一 般 都 遵循 软件 的 生命 周期 理论 ,分 为 6 个 阶段 进行 ,如 图 12.1 所 
示 , 即 需求 分 析 、 概 念 结构 设计 、 逻 辑 结 构 设计 ,物理 结构 设计 、 数 据 库 实施 和 数据 库 的 运 
行 与 维护 。 其 中 ,需求 分 析 和 概念 结构 设计 独立 于 任何 的 DBMS ,而 逻辑 结构 设计 和 物理 
结构 设计 则 与 具体 的 DBMS 有 关 。 

(1) 需求 分 析 : 整个 数据 库 设 计 过 程 的 基础 ,也 是 最 困难 和 耗 时 的 一 步 。 该 阶段 的 
主要 目的 是 要 了 解 和 分 析 系 统 将 要 提供 的 功能 及 未 来 数据 库 用 户 的 数据 需求 ,获得 数据 
库 设 计 所 必需 的 数据 信息 。 这 一 阶段 数据 库 设计 者 同 应 用 领域 的 专家 和 用 户 进行 深入 沟 
通 和 交流 ,了 解 他 们 对 数据 的 要 求 及 已 有 的 业务 流程 ,并 把 这 些 信息 用 数据 流 图 和 数据 字 
典 等 图 表 或 文字 的 形式 记录 下 来 ,最 终 得 到 数据 字典 描述 的 数据 需求 规格 说 明 书 (和 数据 
流 图 描述 的 处 理 需 求 ) 。 

(2) 概念 结构 设计 : 概念 设计 是 根据 需求 分 析 中 得 到 的 信息 ,进行 综合 .归纳 与 抽 
象 ,运用 适当 的 工具 将 这 些 需求 转化 为 数据 库 的 概念 模型 (可 以 用 E-R 图 表示 )。E-R 模 
型 是 Peter Chen 于 1976 年 提出 的 一 种 语义 模型 。 该 模型 是 基于 对 现实 世界 的 这 样 一 种 
认识 : 世界 由 一 组 称 作 实体 的 基本 对 象 及 这 些 对 象 间 的 联系 组 成 。 由 于 E-R 模型 能 将 现 
实 世 界 中 概念 的 含义 和 相互 关联 映射 到 数据 库 概 念 模型 ,因此 许多 数据 库 设计 工具 都 基 
于 它 进行 扩展 。 确 定 实体 .属性 及 它们 之 间 的 联系 ,将 各 个 用 户 的 局 部 视图 合并 成 一 个 总 
的 全 局 视图 ,形成 一 个 独立 于 具体 DBMS 的 概念 模型 。 一 般 来 说 ,概念 设计 的 目的 是 描 
述 数据 库 的 信息 内 容 。 本 章 基 于 E-R 模型 进行 数据 库 概 念 设计 ,其 目的 是 通过 实体 、 联 
系 、 属 性 等 概念 和 工具 精确 地 描述 系统 的 数据 需求 .数据 联系 及 约束 规则 。 

(3) 逻辑 结构 设计 ; 该 阶段 主要 把 概念 结构 设计 阶段 设计 好 的 概念 模型 (基本 E-R 
图 ) 转 换 为 与 选用 数据 库 管理 系统 所 支持 的 数据 模型 相符 合 的 逻辑 结构 。 它 包括 数据 项 、 
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应 用 需求 
(数据 、 处 理 ) 


需求 收集 和 分 析 4 
Ls | 需求 分 析 阶 段 
中 


1 
fe 设计 概念 结构 概念 结构 设计 阶段 
功能 、 优 化 方法 | 1 
| 逻辑 结构 设计 阶段 
数据 模型 优化 | 
应 用 要 求 一 一 一 于 
DBMS 详细 特征 
a 次 计 物 再 结构 物理 结构 设计 阶段 


数据 库 实 施 阶 段 


十 


数据 库 运行 、 维 护 阶段 


使 用 、 维 护 数据 库 十 


图 12.1 数据 库 设计 流程 


记录 与 记录 间 的 联系 ,安全 性 和 一 致 性 约束 等 。 导 出 的 逻辑 结构 是 否 与 概念 模式 一 致 ,从 
功能 和 性 能 上 是 否 满足 用 户 的 要 求 , 要 进行 模式 评价 。 如 果 达 不 到 用 户 要 求 , 还 要 反复 、 
修正 或 重新 设计 。 同 时 分 析 并 发 现 数据 库 逻 辑 模 式 中 存在 的 问题 ,如 减少 数据 元 余 , 消 除 
更 新 ,插入 与 删除 异常 等 ,并 进行 改进 和 优化 。 

(4) 物理 结构 设计 : 该 阶段 主要 考虑 数据 库 要 支持 的 负载 和 应 用 需求 ,为 一 个 给 定 
的 逻辑 数据 模型 选取 一 个 最 适合 应 用 要 求 的 物理 结构 ,根据 DBMS 的 特点 和 处 理 的 需要 
进行 物理 存储 的 安排 ,建立 索引 ,形成 数据 库 的 内 模式 。 

(5) 数据 库 的 实施 : 数据 库 的 实施 阶段 是 建立 数据 库 的 实质 性 阶段 ,在 该 阶段 将 建 
立 实际 数据 库 结构 , 装 入 数据 ,完成 编码 和 进行 测试 ,最 终 使 系统 投入 使 用 。 

(6) 数据 库 的 运行 和 维护 : 运行 和 维护 阶段 是 整个 设计 期 间 最 长 的 时 间 段 ,设计 者 
需要 根据 系统 运行 中 产生 的 问题 及 用 户 的 新 需求 不 断 完善 系统 功能 和 提高 系统 的 性 能 ， 
以 延长 数据 库 使 用 时 间 。 

一 个 完善 的 数据 库 设 计 不 可 能 一 路 而 就 。 我 们 在 每 一 设计 阶段 完成 后 都 要 进行 设计 
分 析 ,评价 一 些 重要 的 设计 指标 ,与 用 户 进行 交流 ,如 果 不 满足 要 求 则 进行 修改 。 在 设计 
过 程 中 ,这 种 评价 和 修改 可 能 会 重复 若干 次 ,以 求 得 理想 的 结果 。 

由 于 数据 库 设计 是 一 个 复杂 而 烦琐 的 过 程 , 近 年 来 ,许多 软件 厂商 通过 研究 ,开发 了 
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许多 计算 机 辅助 数据 库 开 发 工具 ,如 CA 公司 的 ERWin、Sybase 公司 的 PowerDesigner。 
在 设计 过 程 中 适当 使 用 这 些 工 具 , 可 以 提高 数据 库 设计 的 效率 和 质量 。 


12.2 需求 分 析 


需求 分 析 是 整个 数据 库 设 计 过程 中 的 第 一 步 , 也 是 最 重要 的 一 步 , 简 单 地 说 就 是 分 析 
用 户 的 要 求 。 需 求 分 析 是 设计 数据 库 的 起 点 。 需 求 分 析 的 结果 是 否 准确 地 反映 了 客户 的 
实际 要 求 ,将 直接 影响 到 后 面 各 个 阶段 的 设计 ,并 影响 设计 结果 是 否 合理 和 是 否 实用 。 

需求 分 析 的 困难 主要 来 自 于 对 问题 空间 的 理解 ,人 与 人 之 间 的 通信 和 环境 的 不 断 变 
化 三 个 方面 。 由 于 设计 人 员 缺 乏 足 够 的 关于 对 象 系统 的 业务 知识 ,在 系统 调查 时 往往 无 
从 下 手 ,不 知道 该 问 用 户 一 些 什么 问题 ,或 者 被 各 种 数字 大量 的 资料 .庞杂 的 业务 流程 搞 
得 眼花 综 乱 。 另 一 方面 ,用 户 往往 缺乏 计算 机 方面 的 足够 知识 ,不 知道 计算 机 能 做 什么 和 
不 能 做 什么 。 他 们 虽然 精通 自己 的 业务 ,但 常常 不 善于 把 业务 过 程 明 确 地 表达 出 来 ,不知 
道 该 给 设计 人 员 介 绍 些 什么 。 在 这 种 情况 下 ,设计 人 员 很 难 从 用 户 那里 获得 充分 有 用 的 
信息 。 最 后 一 点 ,设计 人 员 常 常 困 惑 环 境 的 变化 ,这 是 由 于 新 的 硬件 .软件 的 出 现 会 使 用 
户 需求 发 生变 化 。 因 此 ,设计 人 员 必 须 与 用 户 不 断 深 入 地 进行 交流 ,才能 逐步 确定 用 户 的 
实际 需求 。 


12.2.1 需求 分 析 的 任务 


需求 分 析 的 任务 就 是 通过 详细 调查 现实 世界 要 处 理 的 对 象 (组 织 部门、 企业 等 ) , 充 
分 了 解 原 系统 (手工 系统 或 计算 机 系统 ) 的 工作 概况 ,明确 用 户 的 各 种 需求 ,然后 在 此 基础 
上 确定 新 系统 的 功能 ,新 系统 必须 充分 考虑 今后 可 能 的 扩充 和 改变 ,不 能 仅 按 当前 的 应 用 
需求 来 设计 数据 库 , 如 图 12. 2 所 示 。 


做 什么 


抽象 化 


逻辑 模型 


图 12.2 需求 分 析 的 任务 


需求 分 析 的 重点 是 调查 、 收 集 与 分 析 用 户 在 数据 管理 中 的 信息 要 求 、 处 理 要 求 、 数 据 
的 安全 性 与 完整 性 要 求 。 通 过 调查 收集 ,分 析 , 获 取 用 户 对 数据 库 的 如 下 具体 要 求 。 

(1) 信息 要 求 : 由 信息 要 求 导出 数据 要 求 , 即 在 数据 库 中 需要 存储 哪些 数据 。 

(2) 处 理 要 求 : 指 用 户 要 完成 的 处 理 功 能 ,对 处 理 的 响应 时 间 以 及 处 理 方式 。 
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(3) 安全 与 完整 性 要 求 : 指数 据 的 保密 措施 和 存 取 控制 要 求 ,数据 自身 的 或 数据 间 
的 约束 限制 。 


12.2.2 需求 分 析 的 步骤 

需求 分 析 的 步骤 主要 包括 调查 组 织 机 构 情 况 ,调查 各 部 门 的 业务 活动 情况 .协助 用 户 
明确 对 新 系统 的 各 种 要 求 、 确 定 新 系统 的 边界 等 4 步 ,具体 内 容 如 下 。 

1. 调查 组 织 机 构 情 况 


调查 组 织 结构 情况 包括 了 解 该 组 织 的 部 门 组 成 情况 、 各 部 门 的 职能 等 , 弄 清 所 设计 的 
数据 库 系统 与 哪些 部 门 相关 ,为 分 析 信 息 流程 做 准备 。 


2. 调查 各 部 门 的 业务 活动 情况 


调查 各 部 门 的 业务 活动 情况 包括 了 解 各 个 部 门 和 他 们 使 用 什么 数据 ,如 何 加 工 处 理 
这 些 数据 ,输出 什么 信息 ,输出 到 什么 部 门 ,输出 结果 的 格式 是 什么 。 


3. 协助 用 户 明确 对 新 系统 的 各 种 要 求 


在 熟悉 了 业务 活动 的 基础 上 ,协助 用 户 明 确 对 新 系统 的 各 种 要 求 ,包括 信息 要 求 、 处 
理 要 求 ,数据 的 安全 性 与 完整 性 要 求 。 


4. 确定 新 系统 的 边界 

确定 哪些 功能 由 计算 机 完成 或 将 来 准备 让 计算 机 完成 ,哪些 功能 由 人 工 完成 。 由 计 
算 机 完成 的 功能 就 是 新 系统 应 该 实现 的 功能 。 
12.2.3 需求 分 析 的 方法 

需求 分 析 的 方法 首先 是 调查 情况 ,确定 新 系统 的 边界 。 需 求 分 析 常 用 的 调查 方法 有 
以 下 几 种 。 

1. 跟班 作业 


通过 亲身 参加 工作 来 了 解 业务 活动 的 情况 。 这 种 方法 可 以 比较 准确 地 了 解 用 户 的 需 
求 , 但 比较 耗费 时 间 和 人 力 。 


2. 开 调查 会 

通过 与 用 户 座谈 来 了 解 业务 活动 的 情况 和 用 户 需求 。 

3. 专人 介绍 

对 于 某 些 业务 活动 的 重要 环节 ,可 以 请 业务 熟练 的 专家 或 用 户 介绍 专业 知识 和 业务 
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活动 情况 ,方便 设计 人 员 从 中 了 解 并 询问 相关 问题 。 
4. 设计 调查 表 请 用 户 填写 


数据 库 设计 人 员 可 以 提前 设计 一 个 合理 的 、 详 细 的 业务 活动 及 数据 要 求 调查 表 , 并 将 
此 表 发 给 相关 用 户 。 用 户 根 据 表 中 的 要 求 ,经 过 认真 思考 、 充 分 准备 后 填写 表 中 的 内 容 。 
如 果 调 查 表 设计 合理 ,这 种 方法 很 有 效 ,也 易于 被 用 户 接受 。 


5. 查阅 数据 记录 


调查 中 还 需要 查阅 相关 数据 记录 ,包括 账本 、 档 案 或 文献 等 。 

调查 了 解 了 用 户 的 需求 后 ,还 需要 进一步 分 析 和 表达 用 户 的 需求 ,在 众多 的 分 析 方 法 
中 ,结构 化 分 析 方 法 (Structure Analysis,SA) 是 一 种 简单 实用 的 方法 。SA 方法 从 最 高 层 
的 系统 组 织 机 构 入 手 ,采用 自 顶 向 下 、 逐 层 分 解 的 方式 分 析 系 统 ,用 数据 流 图 (Data Flow 
Diagram，DFD) .数据 字典 (Data Dictionary,DD) 描 述 系 统 。 调 查 了 解 用 户 的 需求 后 ,还 
需要 进一步 分 析 和 抽象 用 户 的 需求 ,使 用 如 下 方法 。 

1) 使 用 数据 流 图 分 析 信 息 处 理 过 程 

数据 流 图 是 一 种 最 常用 的 结构 化 分 析 工 具 , 它 从 数据 传递 和 加 工 角度 ,以 图 形 的 方式 
刻画 系统 内 的 数据 运动 情况 。 因 为 数据 流 图 是 逻辑 系统 的 图 形 表示 ,即使 不 是 专业 的 计 
算 机 人 员 也 容易 理解 ,所 以 是 很 好 的 交流 工具 。 

数据 流 图 是 有 层次 之 分 的 , 越 高 层次 的 数据 流 图 表现 的 业务 逻辑 越 抽象 , 越 低层 次 的 
数据 流 图 表现 的 业务 逻辑 则 越 具体 。 在 SA 方法 中 ,可 以 把 一 个 系统 都 抽象 为 如 图 12. 3 
所 示 的 形式 。 它 是 最 高 层次 抽象 的 系统 概况 ,要 反映 更 详细 的 内 容 , 可 将 处 理 功能 分 解 为 
若干 子 功能 ,每 个 子 功能 还 可 以 继续 分 解 ,直到 把 系统 工作 过 程 表 示 清 楚 为 止 。 


数据 存储 


数据 来 源 [am 数据 流出 


图 12.3 系统 高 层 抽象 图 


2) 使 用 数据 字典 汇总 各 类 数据 

数据 字典 是 系统 中 各 类 数据 描述 的 集合 ,是 进行 详细 的 数据 收集 和 数据 分 析 所 获得 
的 最 主要 成 果 ,在 数据 库 设计 中 占有 很 重要 的 地 位 和 具有 很 重大 的 意义 。 

数据 字典 通常 包括 数据 项 数据 结 构 .数据 流 ,数据 存储 和 处 理 过 程 5 个 部 分 。 

(1) 数据 项 描述 三 {数据 项 名 ,数据 项 含义 说 明 , 别 名 ,数据 类 型 ,长 度 , 取 值 范围 , 取 
值 含义 ,与 其 他 数据 项 的 逻辑 关系 } 

(2) 数据 结构 描述 一 { 数 据 结 构 名 ,含义 说 明 ,组 成 : {数据 项 或 数据 结构 )} 

(3) 数据 流 描述 一 { 数 据 流 名 ,说 明 ,数据 流 来 源 ,数据 流 去 向 ,组 成 : {数据 结构 }, 平 
均 流 量 ,高 峰 期 流量 } 
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(4) 数据 存储 描述 一 { 数 据 存 储 名 ,说明 ,编号 ,流入 的 数据 流 ,流出 的 数据 流 , 组 成 : 
{数据 结构 ) ,数据 量 , 存 取 方式 } 

(5) 处 理 过 程 描述 二 {处理 过 程 名 ,说 明 , 输 入 : {数据 流 }, 输 出: {数据 流 ) ,处 理 : 
{简要 说 明 })} 

其 中 ,数据 项 是 数据 的 最 小 组 成 单位 ,若干 个 数据 项 可 以 组 成 一 个 数据 结构 。 数 据 字 
上 典 通过 对 数据 项 和 数据 结构 的 定义 来 描述 数据 流 、 数 据 存储 的 逻辑 内 容 。 数 据 字 典 是 关 
于 数据 库 中 数据 的 描述 , 即 元 数据 ,而 不 是 数据 本 身 。 数 据 字典 在 需求 分 析 阶 段 建立 ,并 
在 数据 库 系统 设计 过 程 中 不 断 修改 、 充 实 、 完 善 。 

3) 撰写 需求 说 明 书 

在 数据 库 设 计 中 ,每 个 开发 阶段 的 结果 是 具有 一 定格 式 的 文档 ,这 种 文档 既是 评审 的 
依据 ,也 是 后 续 工作 的 基础 ,但 文档 并 不 是 都 集中 到 一 个 阶段 工作 的 结尾 来 做 ,而 是 贯穿 
在 整个 工作 过 程 中 。 需 求 说 明 书 是 对 项 目 需求 分 析 的 全 部 描述 ,为 接 下 来 的 概念 设计 和 
物理 设计 提供 了 依据 。 

需求 说 明 书 一 般 包括 需求 分 析 的 目标 和 任务 、 具 体 需求 说 明 、 系 统 功 能 和 性 能 、 系 统 
运行 环境 等 。 此 外 ,需求 说 明 书 还 应 包括 在 分 析 过 程 中 得 到 的 数据 流 图 、 数 据 字 典 等 图 表 
说 明 。 需 求 说 明 书 在 完成 后 需要 经 过 用 户 审核 确认 ,充分 核实 要 建立 的 系统 是 否 符合 用 
户 的 需求 ,这 个 过 程 需要 反复 进行 ,直到 双方 达成 一 致 , 方 可 进入 概念 结构 的 设计 。 


12.3 概念 结构 设计 


将 需求 分 析 得 到 的 用 户 需求 抽象 为 信息 结构 即 概念 模型 的 过 程 ,就 是 概念 结构 设计 ， 
它 是 整个 数据 库 设 计 的 关键 。 


12.3.1 概念 模型 的 基本 概念 


概念 结构 设计 的 目标 是 在 需求 分 析 阶 段 产 生 的 需求 说 明 书 的 基础 上 ,按照 特定 的 方 
法 把 它们 抽象 为 一 个 不 依赖 于 任何 具体 机 器 的 数据 模型 , 即 概念 模式 ,描述 概念 结构 的 工 
具 是 E-R 图 。 

概念 模型 是 对 信息 世界 各 类 对 象 、 属 性 及 联系 等 数据 的 描述 。 一 方面 ,概念 模型 应 该 
具有 较 强 的 语义 表达 能 力 , 能 够 方便 ,直观 地 表达 客观 应 用 中 的 各 种 语义 知识 ; 另 一 方面 ， 
还 应 该 简单 清晰、 易于 理解 。 概 念 结构 是 各 种 数据 模型 的 共同 基础 , 它 比 数据 模型 更 独 
立 于 机 器 .更 抽象 ,从 而 更 加 稳定 。 


12.3.2 概念 模型 的 表示 方法 
概念 模型 的 表示 方法 很 多 ,其 中 最 为 著名 且 常 用 的 是 P. P. S. Chen 于 1976 年 提出 的 


实体 -联系 方法 (Entity-Relationship Approach)。 该 方法 用 E-R 图 来 描述 现实 世界 的 概 
念 模型 ,E-R 方法 也 称 为 E-R 模型 。 
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E-R 图 是 描述 概念 世界 、 建 立 概念 模型 的 实用 工具 ,包括 三 个 基本 要 素 。 

(1) 实体 : 客观 存在 并 且 可 以 相互 区 别 的 事物 和 活动 的 抽象 ,例如 一 个 学 生 。 实 体 
用 矩形 框 表 示 ,在 矩形 框 内 写 明 实体 名 称 。 

(2) 属性 : 描述 实体 和 联系 的 特性 ,例如 学 号 、 姓 名、 性 别 等 。 属 性 值 指 属性 的 具体 
取 值 ,例如 ,201523050, 赵 成 刚 , 男 。 属 性 用 椭圆 表示 ,并 用 无 向 边 将 其 与 相应 的 实体 连接 
起 来 。 

(3) 联系 : 用 萎 形 表示 ,菱形 框 内 写 明 联系 名 ,并 用 无 向 边 分 别 与 有 关 实 体 连接 起 
来 ,同时 在 葵 形 的 无 向 边 上 表明 联系 的 类 型 (如 1 :1 或 者 1 :nn, 或 m:n)。 

实体 间 的 联系 有 三 类 , 即 一 对 一 的 联系 (1 : 1) .一 对 多 的 联系 (1 : n) 和 多 对 多 的 联 
系 (m : n)。 

(1) 一 对 一 的 联系 (1 : 1): 实体 集 A 中 的 一 个 实体 ,在 实体 集 B 中 至 多 有 一 个 实体 
与 之 有 联系 ;反之 亦 然 。 

(2) 一 对 多 的 联系 (1 : n) : 实体 集 A 中 的 一 个 实体 ,在 实体 集 B 中 有 n(n 三 0) 个 实 
体 与 之 有 联系 ;反之 ,在 实体 集 B 中 的 实体 ,在 实体 集 A 中 至 多 只 有 一 个 实体 与 之 有 
联系 。 

(3) 多 对 多 的 联系 Cm : n) : 实体 集 A 中 的 一 个 实体 ,在 实体 集 B 中 有 n(n 三 0) 个 实 
体 与 之 有 联系 ;反之 ,在 实体 集 B 中 的 实体 ,在 实体 集 A 中 也 有 m(m 宇 0) 个 实体 与 之 有 

下 面 是 用 E-R 图 来 表示 某 学 校 学 生 选 课 情况 的 概念 模型 ,如 图 12.4 所 示 。 

学 生 选 课 涉 及 的 实体 及 其 属性 如 下 。 

(1) 学 生 : 学 号 、 姓 名, 性别、 出 生年 月 .所 属 班级 。 

(2) 课程 : 课程 号 ,课程 名 称 、 学 时 、 学 分 。 


图 12.4 实体 .实体 属性 及 实体 -关系 模型 图 


12.3.3 概念 结构 的 特点 


概念 结构 的 特点 如 下 。 

(1) 能 真实 充分 地 反映 现实 世界 ,包括 事物 与 事物 之 间 的 联系 ,能 满足 用 户 对 数据 的 
处 理 要 求 , 是 对 现实 世界 的 一 个 真实 建 模 。 

(2) 易于 理解 ,从 而 可 以 用 它 和 不 熟悉 计算 机 的 用 户 交换 意见 ,用 户 的 积极 参与 是 数 
据 库 设计 成 功 的 关键 。 
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(3) 易于 修改 ,应 用 环境 和 应 用 要 求 改变 时 ,容易 对 概念 模型 修改 和 扩充 。 
(4) 易于 向 关系 、 网 状 、 层 次 等 各 种 数据 模型 转换 。 


12.3.4 概念 结构 设计 的 方法 


概念 结构 设计 的 方法 如 下 。 

(1) 自 顶 向 下 方法 : 这 种 方法 是 从 总 体 概念 结构 开始 逐 层 细 化 ,如 图 12. 5 所 示 。 如 
教师 这 个 视图 可 以 从 一 般 教师 开始 ,分解 成 高 级 教师 .普通 教师 等 。 进 一 步 再 由 高 级 教师 
细 化 为 青年 高 级 教师 与 中 年 高 级 教师 等 。 


全 局 概念 模式 


图 12.5 自 项 向 下 策略 


(2) 自 底 向 上 方法 : 这 种 方法 是 从 具体 的 对 象 逐 层 抽 象 ,最 后 形成 总 体 概念 结构 ,是 
被 广泛 使 用 的 方法 ,如 图 12.6 所 示 。 


二 


概念 模式 概念 模式 |…| 概念 模式 概念 模式 


概念 模式 概念 模式 


全 局 概念 模式 


图 12.6 自 底 向 上 策略 


(3) 逐步 扩张 方法 : 这 种 方法 是 从 核心 的 对 象 着 手 , 然 后 向 四 周 逐 步 扩充 ,直到 最 终 
形成 总 体 概念 结构 ,如 图 12. 7 所 示 。 如 教师 视图 可 从 教师 开始 扩展 至 教师 所 担任 的 课 
程 、 上 课 的 教室 与 学 生 等 。 

(4) 混合 策略 方法 : 该 方法 采用 自 项 向 下 和 自 底 向 上 相 结 合 的 方法 , 先 自 项 向 下 定 
义 全 局 框架 ,再 以 它 为 骨架 集成 自 底 向 上 方法 中 设计 的 各 个 局 部 概念 结构 。 在 数据 库 设 
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( ) i 全 局 概念 
结构 


图 12.7 逐步 扩张 策略 


计 中 常用 策略 是 自 顶 向 下 地 进行 需求 分 析 , 自 底 向 上 地 设计 概念 结构 ,如 图 12. 8 所 示 。 


需求 分 析 
( 自 项 向 下 ) 


(应 用 站 


图 12.8 混合 策略 


12.3.5 概念 结构 设计 的 步骤 


概念 结构 是 对 现实 世界 的 一 种 抽象 , 即 对 实际 的 人 、 物 、 事 和 概念 进行 人 为 处 理 , 抽 取 
人 们 关心 的 共同 特性 ,忽略 非 本 质 的 细节 ,并 把 这 些 特 性 用 各 种 概念 精确 地 加 以 描述 。 因 
此 ,概念 模型 设计 通常 采用 自 底 向 下 的 设计 方法 ,将 设计 分 为 局 部 视图 设计 和 视图 集成 两 
个 步骤 进行 。 


1. 局 部 视图 设计 


一 个 整体 的 系统 模型 可 以 有 多 个 局 部 视图 。 各 个 部 门 对 于 数据 的 需求 和 处 理 方式 各 
不 相同 ,对 同一 类 数据 的 观点 也 可 能 不 一 样 ,它们 有 自己 的 视图 ,所 以 可 以 首先 根据 需求 
分 析 阶 段 产 生 的 各 个 部 门 的 数据 流 图 和 数据 字典 中 的 相关 数据 ,设计 出 各 自 的 局 部 视图 。 
数据 流 图 和 数据 字典 中 的 分 析 结 果 是 确定 实体 、 属 性 及 实体 关键 字 的 最 重要 参考 资 
料 。 可 以 先 根据 数据 流 图 中 的 数据 文件 及 相关 内 容 来 确定 视图 中 的 所 有 实体 类 型 及 其 属 
性 ,然后 再 做 必要 的 调整 。 实 体 类 型 确定 之 后 可 为 之 命名 ,使 其 名 称 反映 实体 的 语义 性 
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质 , 然 后 根据 语义 对 每 个 实体 类 型 中 属性 间 的 函数 相关 性 进行 分 析 , 并 确定 能 够 唯一 标识 
实体 的 键 。 

依据 需求 分 析 结果 ,考察 任意 两 个 实体 类 型 之 问 是 否 存在 联系 , 若 有 , 则 确定 其 类 型 
(一 对 一 、 一 对 多 、 多 对 多 ) , 接 下 来 要 确定 哪些 联系 是 有 意义 的 ,哪些 联系 是 元 余 的 ,并 消 
除 元 余 的 联系 。 

确定 了 实体 及 实体 间 的 联系 后 ,可 用 E-R 图 描述 出 来 。 形 成 局 部 E-R 之 后 ,还 必须 
返回 去 征求 用 户 意见 ,使 之 如 实地 反映 现实 世界 ,同时 还 要 进一步 规范 化 ,以 求 改 进 和 完 
善 。 每 个 局 部 视图 必须 满足 : 对 用 户 需求 是 完整 的 ,所 有 实体 、 属 性、 联系 都 是 唯一 的 名 
称 ,不 允许 有 同名 异 义 的 现象 ,无 元 余 的 联系 。 

局 部 E-R 模型 建立 以 后 ,对 照 每 个 应 用 进行 检查 ,确保 模型 能 够 满足 数据 流程 对 数 
据 处 理 的 需求 。 


2. 视图 集成 


当 所 有 局 部 视图 设计 完毕 ,就 可 开始 视图 集成 。 视 图 的 集成 就 是 将 各 子 系统 的 分 E- 
R 图 综合 成 一 个 总 的 E-R 图 。 集 成 阶段 的 主要 任务 是 归并 和 重 构 局 部 视图 ,最 后 得 到 统 
一 的 整体 视图 。 具 体 的 实现 可 以 是 多 个 局 部 E-R 模型 一 次 集成 合并 ,也 可 以 是 两 个 局 部 
E-R 模型 合并 ,并 不 断 累加 。 在 合并 局 部 E-R 模型 得 到 初步 总 体 E-R 模型 ,更 进一步 得 
到 最 后 的 总 体 E-R 模型 的 集成 过 程 中 ,由 于 各 种 差异 ,不 可 避免 地 会 出 现 局 部 E-R 模型 
间 的 不 一 致 ,这 称 为 冲突 。 常 见 的 冲突 有 下 列 几 种 。 

(1) 命名 冲突 。 包 括 属性 名 、 实 体 名 、 联 系 名 之 间 出 现 的 同名 异 义 冲突 和 蜡 名 同 义 
冲突 。 
(2) 属性 冲突 。 包 括 属性 域 冲 突 、 属 性 取 值 单位 冲突 。 

(3) 结构 冲突 。 同 一 对 象 在 不 同 应 用 中 的 不 同 抽象 ;同一 实体 在 不 同 局 部 E-R 模型 
中 的 属性 组 成 不 同 ;实体 间 的 联系 在 不 同 局 部 E-R 模型 中 出 现 不 同 的 类 型 。 

上 述 冲 突 一 般 在 集成 时 需要 做 统一 处 理 , 形 成 一 致 性 的 表示 。 若 是 结构 冲突 , 则 要 采 
用 多 种 技术 手段 来 消除 ,如 把 属性 变换 为 实体 或 把 实体 变换 为 属性 等 。 另 外 ,还 要 消除 不 
必要 的 元 余 , 包 括 元 余数 据 和 元 余 的 联系 。 

集成 后 的 视图 应 满足 以 下 要 求 。 

(1) 完整 性 和 正确 性 , 即 整 个 视图 应 包含 各 局 部 视图 所 表达 的 所 有 语义 ,正确 地 表达 
与 所 有 局 部 视图 应 用 相关 的 数据 观点 。 

(2) 最 小 化 , 即 系统 中 同一 个 对 象 原则 上 只 在 一 个 地 方 表示 。 

(3) 可 理解 性 , 即 整体 视图 对 于 设计 者 和 用 户 都 应 是 易于 理解 的 。 

视图 集成 一 般 有 以 下 两 种 方式 。 

(1) 多 个 分 E-R 图 一 次 集成 。 

(2) 逐步 集成 ,如 用 累加 的 方式 一 次 集成 两 个 分 E-R 图 。 

局 部 视图 的 集成 一 般 分 为 两 步 : 第 一 步 消除 冲突 ,把 各 分 E-R 模型 合并 起 来 生成 初 
步 E-R 模型 ;第 二 步 对 初步 E-R 模型 进行 修改 ,消除 不 必要 的 需 余 ,生成 基本 的 E-R 
模型 。 
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12.4 规范 化 


为 了 使 数据 库 设计 的 方法 走向 完备 ,人 们 研究 了 规范 化 理论 。 关 系 必须 规范 化 , 即 关 
系 模型 中 的 每 一 个 关系 模式 都 必须 满足 一 定 的 要 求 。 规 范 化 有 很 多 层次 ,对 关系 最 基本 
的 要 求 是 每 个 属性 值 必须 是 不 可 分 割 的 数据 单元 , 即 表 中 不 能 再 包含 表 。 


12.4.1 关系 模式 规范 化 的 必要 性 


规范 化 的 原因 很 多 ,其 主要 原因 是 不 规范 的 关系 模式 在 应 用 中 可 能 产生 很 多 刺 病 , 导 
致 产生 各 种 存储 异常 。 最 常见 的 存储 异常 问题 如 下 所 示 。 

(1) 数据 宛 余 。 数 据 库 中 不 必要 的 重复 存储 就 是 数据 元 余 , 要 避免 这 一 点 ,需要 数据 
库 设 计 人 员 具 有 丰富 的 设计 经 验 。 

(2) 更 新 异常 。 当 重复 信息 的 一 个 副本 被 修改 时 ,所 有 副本 都 必须 进行 同样 的 修改 。 
因此 当 更 新 数据 时 ,系统 要 付出 很 大 的 代价 来 维护 数据 库 的 完整 性 ,否则 会 面临 数据 不 一 
致 的 危险 。 

(3) 插入 异常 。 只 有 当 一 些 信 息 事 先 已 经 存放 在 数据 库 中 时 ,另外 一 些 信息 才能 存 
入 数据 库 中 。 

(4) 删除 异常 。 删 除 某 些 信息 时 可 能 丢失 其 他 信息 。 

【 例 12.1】 考虑 学 生 选 课 关系 模式 : SScore(sno，sname，classNo，className， 
cno，cname，score) ,属性 集 {sno，cno} 是 主 码 。 如 果 人 允许 一 个 学 生 选 修 多 门 课程 , 且 一 
门 课程 可 被 多 个 学 生 选 修 , 则 该 关系 实例 可 能 出 现 数据 宛 余 , 如 表 12. 1 所 示 。 


表 12.1 学 生 选 课 关 系 表 


sno sname | classNo className cno cname score 
201823001 | 李 婷 婷 | IS1801 “| 信息 管理 与 信息 系统 18_01 班 | 001 | 高 等 数学 61 
201823001 | 李 婷 婷 | IS1801 | 信息 管理 与 信息 系统 18_01 班 | 003 | 计算 机 原理 98 
201823001 | 李 婷 婷 | IS1801 | 信息 管理 与 信息 系统 18_01 班 | 006 | 数据 库 系统 原理 89 
201823002 | 梁 启 永 |CS1801 | 计算 机 科学 与 技术 18_01 班 001 | 高 等 数学 62 
201823002 | 梁 启 永 |CS1801 | 计算 机 科学 与 技术 18_01 班 002 | 离散 数学 80 


201823002 | 梁 启 永 |CS1801 | 计算 机 科学 与 技术 18_01 班 004 | C 语 言 程序 设计 47 
201823002 | 梁 启 永 |CS1801 | 计算 机 科学 与 技术 18_01 班 006 | 数据 库 系统 原理 90 
201823003 | 康 鑫 宇 | MP1801 | 市 场 营销 18_01 班 001 | 高 等 数学 62 
201823003 | 康 鑫 宇 | MP1801 | 市 场 营 销 18_01 班 002 | 离散 数学 60 


如 果 人 允许 一 个 学 生 选 修 多 门 课程 , 且 一 门 课程 可 被 多 个 学 生 选 修 , 则 该 关系 实例 可 能 
出 现 如 下 问题 。 
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(1) 宛 余 存储 : 学 生 姓名 和 课程 名 被 重复 存储 多 次 。 

(2) 更 新 异常 : 当 修改 某 学 生 的 姓名 或 某 课程 的 课程 名 时 ,可 能 只 修改 了 部 分 副本 
的 信息 ,而 其 他 副本 未 被 修改 到 。 

(3) 插入 异常 : 如 果 某 学 生 没有 选修 课程 ,或 某 课程 未 被 任何 学 生 选 修 时 , 则 该 学 生 
或 该 课程 信息 不 能 存 入 数据库 ,因为 主 码 值 不 能 为 空 。 

(4) 删除 异常 : 当 某 学 生 的 所 有 选修 课程 信息 都 被 删除 时 , 则 该 学 生 的 信息 将 被 丢 
失 。 对 课程 也 是 如 此 。 

而 产生 上 述 异 常 现象 的 原因 就 是 关系 模式 设计 不 合理 ,因此 ,必须 有 一 个 规范 可 以 遵 
循 。 函 数 依赖 理论 正 是 用 来 改造 关系 模式 的 ,通过 分 解 较 大 的 关系 模式 来 消除 其 中 不 合 
适 的 数据 依赖 ,以 解决 数据 元 余 及 其 带 来 的 各 种 问题 。 理 想 情况 下 ,我 们 希望 没有 模式 元 
余 , 但 有 时 出 于 性 能 方面 考虑 ,可 能 会 接受 一 些 带 有 宛 余 的 模式 。 


12.4.2 范 数 依赖 


关系 中 属性 之 间 这 种 相互 依赖 又 相互 制约 的 联系 称 为 数据 依赖 ,数据 依赖 主要 有 两 
种 形式 ,分 别 为 函数 依赖 和 多 值 依赖 。 

函数 依赖 是 从 数学 角度 来 定义 的 ,在 关系 中 用 来 刻画 关系 各 属性 之 间 相 互 制约 而 又 
相互 依赖 的 情况 。 函 数 依赖 普遍 存在 于 现实 生活 中 ,例如 ,描述 一 个 学 生 的 关系 ,可 以 有 
学 号 ,姓名 、 所 属 班级 等 多 个 属性 ,由 于 一 个 学 号 对 应 一 个 且 仅 一 个 学 生 , 一 个 学 生 就 读 于 
一 个 确定 的 系 ,因而 当 *“ 学 号 ”属性 的 值 确定 之 后 ,“ 姓 名 ”及 “所 属 班 级 ”的 值 也 就 唯一 地 确 
定 了 ,此 时 ,就 可 以 称 “ 姓 名 ”和 “所 属 班级 ”函数 依赖 于 “学 号 ”, 或 者 说 “学 号 ”函数 决定 “ 姓 
名 ”和 “所 属 班 级 ”, 记 作 ; 学 号 一 姓名 、 学 号 一 所 属 班级 。 下 面 对 函 数 依赖 给 出 确切 的 
定义 。 

定义 12.1 设 r(R) 为 关系 模式 ,aCSR,BCR。 对 任意 合法 关系 x 及 其 中 任 两 个 元 组 
ti 和 j,i 六 j ,车 tiLaj 二 tyLaj; 则 4[j=w[ 书 , 则 称 a 函数 确定 8B, 或 8B 函数 依赖 于 a, 记 作 
ap8。 如 图 12. 9 所 示 。 其 中 ,a 称 为 决定 因素 。 进 而 若 再 有 B>a, 则 称 zx 与 y 相互 依赖 ， 


记 作 c< -~ 有 。 


图 12.9 a>B 函数 依赖 图 


例如 ,对 于 Student(Sno，Major) ,假定 每 个 学 生 都 有 唯一 的 学 号 Sno ,每 个 学 生 有 且 
只 有 一 个 专业 Major, 则 只 要 给 定 Sno 的 值 ,就 可 以 弄 清 楚 该 学 生 的 专业 。“ 学 生 专业 ” 函 
数 依赖 于 “学 生 学 号 ”, 或 “学 生 学 号 ”函数 决定 “学 生 专 业 ”。 函 数 依赖 使 用 下 面 的 形式 来 
书写 : Sno~~Major。 按 照 习惯 ,一般 将 箭头 左边 的 属性 称 为 决定 因素 。 

对 于 函数 依赖 ,应 该 注意 以 下 几 点 。 

(1) 函数 依赖 是 指 关系 模型 R 中 所 有 的 元 组 都 要 满足 的 约 东 条 件 , 而 不 仅仅 是 某 个 
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或 某 些 元 组 的 特例 。 

(2) 函数 依赖 并 不 一 定 具 有 可 逆 性 。 还 以 表 Student 为 例 , 如 果 Sno 决定 Major, 则 
一 个 特定 的 Sno 的 值 只 能 和 一 个 特定 的 Major 配对 。 相 反 ,一 个 Major 值 可 以 和 一 个 或 
多 个 Sno 值 配 对 (一 个 专业 可 以 有 多 名 学 生 )。 因 此 Major( 学 生 专业 ) 并 不 能 决定 Sno 
(学 生 学 号 ) 。 也 就 是 说 ,如 果 a->p, 但 反 过 来 不 一 定 有 B>a。 一 般 地 ,如 果 A 决定 BB, 那 
么 ,A 和 B 之 间 的 关系 是 一 对 多 (1 : n) 的 关系 。 

(3) 函数 依赖 中 可 以 包含 属性 组 。 考 虑 关系 表 Score(sno,cno,score) , 表 中 的 意思 是 
某 位 学 生 (sno) 的 某 门 功课 (cno) 的 成 绩 (score) 。 当 要 查找 成 绩 时 ,必须 事先 知道 该 学 生 
的 学 号 和 该 门 功课 的 课程 号 , 缺 一 不 可 。“ 学 号 ”和 “课程 号 ”的 结合 决定 了 “成 绩 ”, 该 函数 
依赖 记 作 : (sno,cno) 一 score。 

(4) 函数 依赖 是 语义 范畴 的 概念 ,只 能 根据 数据 的 语义 来 确定 函数 依赖 ,是 不 能 够 被 
证 明 的 。 例 如 ,“ 姓 名 二 出 生年 月 ”这 个 函数 依赖 只 有 在 没有 重 名 的 条 件 下 成 立 。 如 果 有 
相同 名 字 的 人 , 则 “出 生年 月 ”就 不 再 函数 依赖 于 “姓名 ”了 。 数 据 库 设 计 者 可 以 对 现实 世 
界 做 强制 的 规定 , 若 发 现 有 同名 人 存在 , 则 拒绝 插入 该 元 组 。 

函数 依赖 中 还 可 细 分 为 多 种 函数 依赖 ,分 别 介绍 如 下 。 


1. 完全 函数 依赖 和 部 分 函数 依赖 


定义 12.2 在 关系 模式 r(R) 中 ,aCR,BCR, 且 a>B 是非 平凡 函数 依赖 。 若 对 任意 
的 YCa,Y™B 都 不 成 立 , 则 称 a>B 是 完全 函数 依赖 ,简称 完全 依赖 。 否 则 , 若 存 在 非 空 的 
YCa, 使 Yy>B 成 立 , 则 称 a>B 是 部 分 函数 依赖 ,简称 部 分 依赖 ,如 图 12. 10 所 示 。 所 谓 完 
全 依赖 是 指 在 依赖 关系 的 决定 项 ( 即 依赖 关系 的 左 项 ) 中 没有 多 余 属 性 ,有 多 余 属 性 就 是 


部 分 依赖 。 
a 
< 


图 12.10 部 分 依赖 a>p 的 依赖 图 


当 a 是 单 属性 时 , 则 a>p 完 全 函数 依赖 总 是 成 立 的 。 

例如 ,在 例 12. 1 中 的 学 生 选 课 关 系 模式 SScore(sno, sname, classNo, className， 
cno，cname，score) 中 ,存在 下 列 完全 依赖 。 

sno>sname 

sno>classNo 

sno>className 

cno>cname 

{sno, cno}—>score 

而 下 列 依赖 则 是 部 分 依赖 。 


{sno, cno}—>sname 
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{sno, cno}—>classNo 
{sno, cno}—>className 


{sno, cno} >cname 


对 候选 码 的 部 分 函数 依赖 会 导致 数据 元 余 和 插入 、 删 除 、 更 新 异常 。 
2. 传递 函数 依赖 


定义 12.3 在 关系 模式 x(R) 中 , 设 aCR,BCR,YCSR, 且 Ba,7Y 折 B。 若 a>B,B a， 
BY, 则 必 存 在 函数 依赖 a>7, 则 称 a->y 是 传递 函数 依赖 ,简称 传递 依赖 ,如 图 12. 11 所 
示 。 与 部 分 依赖 一 样 ,传递 依赖 也 可 能 会 导致 数据 元 余 及 产生 各 种 异常 。 


gs 
Cu) Toy Tr) 


图 12.11 传递 依赖 a>7 的 依赖 图 


【 例 12.2】 在 学 生 班 级 关系 模式 StuClass(sno, classNo, className, institute) 中 ， 
存在 下 列 函 数 依赖 ; 

sno>classNo 

class No>className 

classNo>institute 

因此 ,该 关系 模式 中 存在 下 列传 递 函数 依赖 : 

sno>className 

sno>institute 

因此 可 能 导致 数据 宛 余 、 更 新 异常 ,插入 异常 及 删除 异常 。 

函数 依赖 是 指 关 系 模式 中 属性 之 间 存 在 的 一 种 约束 关系 。 这 种 约束 关系 既 可 以 是 现 
实 世 界 事物 或 联系 的 属性 之 间 客 观 存在 的 约束 ,也 可 以 是 数据 库 设 计 者 根据 应 用 需求 或 
设计 需要 强加 给 数据 的 一 种 约束 。 但 不 论 是 哪 种 约束 ,一 旦 确定 ,进入 数据 库 中 的 所 有 数 
据 都 必须 严格 遵守 。 正 确 了 解数 据 的 意义 及 确定 属性 之 间 的 函数 依赖 关系 ,对 设计 一 个 
好 的 关系 模式 是 十 分 重要 的 。 


12.4.3 范式 与 规范 化 


范式 就 是 符合 某 一 种 级 别 的 关系 模式 的 集合 。 一 个 关系 模式 满足 一 定 的 要 求 , 则 称 
此 关系 模式 为 特定 范式 的 关系 模式 。 从 范式 来 讲 ,主要 是 E. F. Codd 做 的 工作 ,1971 一 
1972 年 他 系统 地 提出 了 1NF、2NF、3NF 的 概念 ,讨论 了 规范 化 的 问题 。1974 年 ,Codd 
和 Boyce 又 共同 提出 了 一 个 新 的 范式 , 即 BCNF。1976 年 ,FagiN 又 提出 了 4NF。 满 足 
最 低 要 求 的 叫 作 第 一 范式 ,简称 1NF ,在 第 一 范式 中 满足 进一步 要 求 的 为 第 二 范式 ,以 此 
类 推 。 各 范式 之 间 的 联系 有 4NFCBCNFC3NFC2NFCINF 成 立 。 即 满足 BCNF 范式 
的 关系 一 定 满足 3NF 范式 ,满足 3NF 范式 的 关系 一 定 满 足 2NF 范式 ,满足 2NF 范式 的 
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关系 一 定 满足 1NF 范式 。 各 种 范式 之 间 的 联系 可 
以 用 图 12. 12 简单 描述 。 

一 个 低 一 级 的 关系 模式 ,通过 模式 分 解 转换 为 
若干 个 高 一 级 范式 的 关系 模式 的 集合 ,这 一 过 程 就 
叫 规范 化 。 下 面 主 要 讨论 INF、2NF、3NF 和 
BCNF 范式 。 

1. 第 一 范式 


定义 12.4 如 果 一 关系 模式 r(R) 的 每 个 属性 
对 应 的 域 值 都 是 不 可 分 的 ( 即 原子 的 ), 则 称 r(R) 
属于 第 一 范式 , 记 为 r-(R)E 1NF。 图 12.12 各 种 范式 之 间 的 关系 

第 一 范式 的 目标 是 : 将 基本 数据 划分 成 称 为 
实体 集 或 表 的 逻辑 单元 , 当 设 计 好 每 个 实体 后 ,需要 为 其 指定 主 码 。 

关系 数据 库 的 模式 至 少 应 是 第 一 范式 。 表 12. 2 是 一 个 非 规范 化 的 关系 模式 结构 , 因 
为 familyaddress 的 值 域 是 可 分 的 。 


表 12.2 非 规范 化 的 关系 模式 


familyaddress 
Sno sname sex birthday 区 classNo 
province 


将 上 述 关 系 模式 变 为 如 表 12. 3 所 示 的 形式 才 是 满足 1NF 范式 的 关系 模式 。 
表 12.3 1NF 规范 化 后 的 关系 模式 


2. 第 二 范式 


classNo 


定义 12.5 如果 一 个 关系 模式 r(R)E 1NF, 且 所 有 非 主 属性 都 完全 函数 依赖 于 
r(R) 的 候选 码 , 则 称 r-(R) 属 于 第 二 范式 , 记 为 r(R)E2NF。 

例如 ,在 例 12. 1 中 的 学 生 选 课 关 系 模式 SScore(sno, sname, classNo, className， 
cno，cname，score) 中 存在 依赖 关系 sno 习 sname,sno 习 classNo,sno 习 className 和 cno 
一 cname 属于 第 一 范式 ,但 它 不 属于 第 二 范式 。 原 因 是 存在 非 主 属性 sname，classNo， 
className 和 cname 部 分 依赖 于 SScore 的 主键 {sno, cno) ,所 以 SScore 违反 了 2NF 的 
定义 ,SScore 代 2NF。 

也 就 是 说 ,在 满足 第 一 范式 的 实体 中 ,如 果 有 复合 候选 码 ( 即 多 个 属性 共同 构成 的 候 
选 码 ) ,那么 所 有 非 主 属性 必须 依赖 于 全 部 的 候选 码 , 不 允许 依赖 于 部 分 的 候选 码 属性 。 
即 不 允许 候选 码 的 一 部 分 对 非 主 属性 起 决定 作用 . 全 部 是 码 。 

第 二 范式 的 目标 : 将 只 部 分 依赖 于 候选 码 ( 即 依赖 于 候选 码 的 部 分 属性 ) 的 非 主 属性 
移 到 其 他 表 中 。 违 背 2NF 的 模式 , 即 存 在 非 主 属性 对 候选 码 的 部 分 依赖 ,消除 部 分 函数 
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依赖 的 方法 就 是 将 关系 分 解 ,使 其 新 的 关系 中 非 主 属性 与 候选 键 之 间 不 存在 部 分 函数 
依赖 。 

分 解 的 方法 是 投影 。 具 体 地 说 就 是 : 用 组 成 候选 键 的 属性 集合 的 每 一 个 非 空 真 子 集 
作为 主键 构成 一 个 新 关系 ;对 于 每 个 新 关系 ,将 完全 依赖 或 传递 依赖 于 此 主键 的 属性 放置 
到 此 关系 中 。 下 面 将 SScore 关系 按 上 述 方法 分 解 如 下 。 

(1) SScore 关系 只 有 一 个 候选 键 ,也 就 是 主键 (sno,cno)。 

(2) 它 的 非 空子 集 有 sno、cno、(sno,cno)。 对 应 构成 三 个 新 关系 , 设 分 别 为 Student、 
Course 和 Score。 其 中 , Student 的 主键 为 sno, Course 的 主键 为 cno, Score 的 主键 为 
(sno,cno)。 

(3) 将 完全 依赖 或 传递 依赖 于 sno 主键 的 属性 放置 到 Student 表 中 ,完全 依赖 或 传递 
依赖 于 cno 主键 的 属性 放置 到 Course 表 中 ,完全 依赖 或 传递 依赖 于 (sno,cno) 主 键 的 属 
性 放置 到 Score 表 中 得 到 

Student(sno,sname, classNo, className) 

Course(cno,cname) 

Score(sno,cno, score) 

根据 2NF 的 标准 衡量 ,这 三 个 关系 中 都 不 存在 非 主 属性 部 分 函数 依赖 于 候选 键 的 情 
况 , 所 以 它们 都 属于 2NF。 即 StudentE 2NF、Course€ 2NF ScoreE2NF。 结 果 宛 余 问 
题 已 得 到 明显 改善 ,第 二 范式 虽然 消除 了 由 于 非 主 属性 对 候选 码 的 部 分 依赖 所 引起 的 宛 
余 及 各 种 异常 ,但 并 没有 排除 传递 依赖 ,还 有 一 定 的 数据 宛 余 ,还 存在 插入 异常 和 删除 蜡 
常 。 因 此 ,还 需要 对 其 进一步 规范 化 。 


3. 第 三 范式 


定义 12.6 ”如 果 一 个 关系 模式 ~(R)E2NF, 且 所 有 非 主 属性 都 直接 函数 依赖 于 
r(R) 的 候选 码 ( 即 不 存在 非 主 属性 传递 依赖 于 候选 码 ), 则 称 ~(R) 属 于 第 三 范式 , 记 为 
r(R)E3NF。 

也 就 是 说 ,在 满足 2NF 的 实体 中 , 非 主 属性 不 能 依赖 于 另 一 个 非 主 属性 ( 即 非 主 属性 
只 能 直接 依赖 于 候选 码 ) 。 

第 三 范式 的 目标 : 去 掉 表 中 不 直接 依赖 于 候选 码 的 非 主 属性 。 

总 之 ,所 有 的 非 主 属性 应 该 直接 依赖 于 ( 即 不 能 存在 传递 依赖 ,这 是 3NF 的 要 求 ) 全 
部 的 候选 码 ( 即 必 须 完全 依赖 ,不 能 存在 部 分 依赖 ,这 是 2NF 的 要 求 ) 。 

在 例 12. 1 中 的 学 生 选 课 关 系 模 式 SScore(sno，sname，classNo，className，cno， 
cname，score) 经 过 部 分 依赖 的 分 解 后 得 到 的 三 个 关系 Student、Course、Score, 它 们 都 属 
于 第 二 范式 了 。 但 Student(sno,sname，classNo，className) 不 属于 3NF。 原 因 是 存在 
非 主 属性 className 传递 函数 依赖 于 候选 键 sno。 根 据 3NF 的 定义 , Students 不 属 
于 3NF。 

一 个 关系 尺 若 仅 属于 2NF 但 不 属于 3NF, 如 关系 Students 仍然 存在 数据 宛 余 过 
多 .删除 异常 和 插入 异常 等 问题 ,解决 的 办 法 仍然 是 分 解 ,以 消除 传递 依赖 。 具 体 方法 
如 下 。 
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(1) 对 于 不 是 候选 键 的 每 个 决定 因子 ,从 原 关系 中 删 去 依赖 于 它 的 所 有 属性 。 

(2) 对 原 关系 中 不 是 候选 键 的 每 个 决定 因子 ,新 建 一 个 关系 ,新 关系 中 包含 依赖 该 决 
定 因子 的 属性 。 

(3) 将 该 决定 因子 加 入 新 关系 并 作为 新 关系 的 主键 。 

按 上 述 方法 来 分 解 Students 关系 得 到 : 

Student(sno,sname,classNo) 

Class(classNo, className) 

最 终 得 到 的 所 有 关系 如 下 。 

Student(sno, sname,classNo) 

Class(classNo, className) 

Course(cno,cname) 

Score(sno,cno, score) 
都 已 经 属于 3NF 的 关系 。 对 于 一 般 的 数据 库 应 用 来 说 ,设计 出 的 关系 符合 第 三 范式 标准 就 够 
了 。 因 为 ,一 般 来 说 ,满足 3NF 的 关系 已 能 消除 元 余 和 各 种 异常 现象 ,获得 较 满意 的 效果 。 


4. BCNF 


定义 12.7 给 定 关 系 模式 r(R) 及 函数 依赖 集 下 ,车 F* (表示 下 的 闭 包 ) 中 的 所 有 函 
数 依赖 a 一 B(aSR,BCSR) 至 少 满足 下 列 条 件 之 一 : 

(1) a>B 是 平凡 函数 依赖 ( 即 BSa); 

(2) a 是 r(R) 的 一 个 超 码 ( 即 of 中 包含 R 的 全 部 属性 ) 。 
则 称 ~(R) 属 于 Boyce-Codd 范式 , 记 为 r(R)EBCNF。 

换 句 话说 ,在 关系 模式 r(R) 中 ,如 果 F* 中 的 每 一 个 非 平凡 函数 依赖 的 决定 属性 集 a 
都 包含 候选 码 , 则 xr(R)E BCNF。 需要 特别 说 明 的 是 ,为 确定 r(R) 是 否 满足 BCNF 范式 ， 
必须 考虑 F+ 而 不 是 下 中 的 每 个 函数 依赖 。 

从 函数 依赖 角度 可 得 出 ,一 个 满足 BCNF 的 关系 模式 必然 满足 下 列 结论 (如 果 a 一 B 
非 平凡 , 则 a 是 x(R) 的 一 个 超 码 ): 

(1) 所 有 非 主 属性 都 完全 函数 依赖 于 每 个 候选 码 ; 

(2) 所 有 主 属性 都 完全 函数 依赖 于 每 个 不 包含 它 的 候选 码 ; 

(3) 没有 任何 属性 完全 函数 依赖 于 非 候选 码 的 任何 一 组 属性 。 

因此 ,BCNF 不 仅 排 除了 任何 属性 (包括 主 属性 和 非 主 属性 ) 对 候选 码 的 部 分 依赖 和 
传递 依赖 ,而 且 排 除了 主 属性 之 间 的 传递 依赖 ,其 依赖 关系 如 图 12. 13 所 示 。 


图 12.13 BCNF 关系 模式 中 的 函数 依赖 
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5. 第 四 范式 


定义 12.8 设 一 个 关系 模式 RE1NF, 若 XX 一 >Y(YCEX) 是 非 平凡 的 多 值 依 赖 , 且 
X 含 有 码 , 则 RE4NF。 

通俗 地 说 ,一 个 关系 如 果 已 满足 BCNF, 且 没有 多 值 依赖 , 则 关系 属于 4NF。 一 个 关 
系 模 式 RE4NF, 则 必 有 REBCNF。 如 不 满足 4NF ,解决 这 些 问 题 的 方法 仍然 是 继续 分 
解 消除 非 平凡 的 非 函 数 多 值 依赖 ,使 之 满足 4NF 的 要 求 。 


12.4.4 模式 分 解 原则 


模式 分 解 主要 涉及 以 下 两 个 原则 。 

(1) 无 损 连 接 (Lossless Join) 。 如 果 对 新 的 关系 进行 自然 连接 得 到 的 元 组 的 集合 与 
原 关系 完全 一 致 , 则 称 为 无 损 连接 。 无 损 连 接 反 映 了 模式 分 解 的 数据 等 价 原则 。 

(2) 保持 依赖 (Preserve Dependency) 。 如 果 分 解 后 总 的 函数 依赖 集 与 原 函 数 依赖 集 
保持 一 致 , 则 称 为 保持 依赖 。 保 持 依赖 反映 了 模式 分 解 的 依赖 等 价 原则 。 依 赖 等 价 保证 
了 分 解 后 的 模式 与 原 有 的 模式 在 数据 语义 上 的 一 致 性 。 


12.4.5 规范 化 的 本 质 分 析 与 总 结 


规范 化 是 通过 对 已 有 的 关系 模式 进行 分 解 来 实现 的 。 把 低 一 级 的 关系 模式 分 解 为 多 
个 高 一 级 的 关系 模式 ,使 模式 中 的 各 关系 达到 某 种 程度 的 分 离 ,让 一 个 关系 只 描述 一 个 实 
体 或 实体 间 的 联系 。 规 范 化 实质 上 就 是 概念 的 单一 化 。1NF、2NF、3NF、BCNF 和 4NF 
之 间 逐 步 深 化 的 过 程 如 图 12. 14 所 示 。 

上 规范 化 关系 

1 ”消除 非 原子 分 量 
INF 
消除 非 主 属性 对 关键 字 的 部 分 函数 依赖 
2NF 
消除 非 主 属性 对 关键 字 的 传递 函数 依赖 
3NF 
消除 主 属性 对 关键 字 的 部 分 和 传递 函数 依赖 
BCNF 
1 消除 非 平凡 且 非 函数 的 多 值 依赖 
4NF 


图 12.14 规范 化 的 过 程 


通过 逐步 地 规范 化 ,不 断 提高 模式 的 级 别 , 人 们 可 以 最 大 限度 地 消除 关系 模式 中 插 
入 .删除 和 修改 的 异常 。 但 在 数据 库 的 设计 实践 中 ,单纯 地 分 解 关系 ,提高 关系 的 范式 级 
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别 并 不 一 定 就 能 产生 合理 的 方案 。 

下 面 从 数据 库 设计 实践 的 角度 给 出 几 条 经 验 原则 。 

(1) 部 分 函数 依赖 和 传递 函数 依赖 的 存在 是 产生 数据 元 余 、 更 新 异常 的 重要 原因 。 
因此 ,在 关系 规范 化 中 ,应 尽 可 能 消除 属性 间 的 这 些 依赖 关系 。 

(2) 非 第 三 范式 的 1NF、2NF 以 至 非 规范 化 的 模式 ,由 于 它们 性 能 上 的 弱点 ,一 般 不 
宜 作为 数据 库 模式 。 

(3) 由 于 第 三 范式 的 关系 模式 中 不 存在 非 主 属 性 对 关键 字 的 部 分 依赖 和 传递 依赖 关 
系 ,因而 消除 了 很 大 一 部 分 宛 余 和 更 新 异常 ,具有 较 好 的 性 能 ,所 以 ,一般 要 求 数据 库 设计 
达到 3NF。 

总 结 规范 化 的 本 质 , 即 “一 事 一 地 ”。 如 果 某 个 关系 有 两 个 或 多 个 事实 , 它 就 应 该 分 解 
为 多 个 关系 ,每 个 关系 只 包含 一 种 事实 。 每 当 分 解 关系 时 ,都 应 该 考虑 建立 关系 之 间 的 关 
联 , 加 入 必要 的 外 键 。 因 为 对 关系 进行 的 每 一 次 分 解 都 会 产生 参照 完整 性 约束 。 因 此 ,每 
当 把 一 个 关系 分 解 为 两 个 或 多 个 时 ,就 要 检查 这 种 约束 。 


12.5 逻辑 结构 设计 


关系 数据 库 设计 需要 设计 出 数据 库 赖 以 实现 的 实现 模型 ,现在 用 的 实现 模型 都 是 关 
系 模型 ,因此 需要 设计 一 个 关系 模型 。 关 系 模型 的 数据 结构 是 关系 ,一 个 关系 用 一 个 关系 
模式 表示 。 所 有 的 关系 模式 组 成 数据 库 的 模式 ,所 以 关系 数据 库 设 计 就 是 要 设计 出 数据 
库 的 模式 ,也 称 逻辑 结构 或 逻辑 模型 。 

设计 逻辑 结构 应 该 选择 最 适合 描述 与 表达 相应 概念 结构 的 数据 模型 ,然后 选择 最 合 
适 的 DBMS。 目前 ,DBMS 产品 一 般 只 支持 关系 、 网 状 和 层次 三 种 模型 中 的 一 种 。 对 于 
某 一 种 数据 模型 ,各 个 机 器 系统 又 有 许多 不 同 的 限制 ,提供 不 同 的 环境 与 工具 。 所 以 , 设 
计 人 逻辑 结构 时 一 般 要 分 为 以 下 三 步 进行 。 

(1) 将 概念 结构 转换 为 一 般 的 关系 、 网 状 或 层次 模型 ; 

(2) 将 转换 来 的 关系 、 网 状 或 层次 模型 向 特定 DBMS 支持 下 的 数据 模型 转换 ， 

(3) 对 数据 模型 进行 优化 。 


12.5.1 概念 模型 向 关系 模型 的 转换 


设计 方法 是 将 实体 -联系 模型 转换 为 关系 模型 ,用 若干 个 关系 模式 来 表示 。 实 体 - 联 
系 模型 由 实体 、 属 性 ,标识 符 和 实体 之 间 的 联系 等 要 素 组 成 ,所 以 将 实体 -联系 模型 转换 为 
关系 模型 ,实际 上 就 是 要 将 ER 图 中 实体 、 实 体 的 属性 和 实体 之 间 的 联系 等 转换 为 若干 
个 关系 模式 ,并 确定 这 些 关系 模式 的 属性 、 关 键 字 和 约束 。 

E-R 图 的 转换 规则 如 下 。 

(1) 一 个 实体 型 转换 为 一 个 关系 模型 ,实体 的 属性 就 是 关系 的 属性 ,实体 的 键 就 是 关 
系 的 键 。 例 如 ,如 图 12. 15 所 示 的 实体 类 型 “学 生 ” 可 转换 成 如 下 的 关系 模式 。 

学 生 ( 学 号 ,姓名 ,性 别 , 出 生年 月 ,所 属 班级 ) 
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其 中 , 带 下 画 线 的 属性 为 主 属性 。 


DD ry 
DN 


忆 》 学 生 ( 学 号 ， 姓名， 性 别 ， 出 生年 月 ， 所 属 班级 ) 
图 12.15 一 个 实体 类 型 转换 为 一 个 关系 模式 


(2) 一 个 联系 转换 为 一 个 关系 模式 ,与 该 联系 相连 的 每 个 实体 型 的 键 以 及 联系 的 属 
性 都 转换 为 关系 的 属性 。 这 个 关系 的 键 分 为 以 下 三 种 不 同 的 情况 。 

@ 若 联系 为 1 : 1, 有 两 种 转换 方式 : 一 是 转换 为 一 个 独立 的 关系 模式 ,联系 名 为 关 
系 模式 名 ,与 该 联系 相连 的 两 个 实体 的 关键 字 及 联系 本 身 的 属性 为 关系 模式 的 属性 ,其 实 
每 个 实体 的 关键 字 均 是 该 关系 模式 的 候选 键 ; 二 是 与 另 一 端的 关系 模式 合并 ,可 将 相关 的 
两 个 实体 分 别 转换 为 两 个 关系 ,并 在 任意 一 个 关系 的 属性 中 加 入 另 一 个 关系 的 主 关键 字 。 
转换 方法 及 具体 实例 如 图 12. 16 所 示 。 


二 
身份 证 《全 份 证 本 》 方案 |， 拥有 1 表 ( 息 份 下 号 ， 教 工 号 


lL 方案 2: 拥有 2 表 ( 教 工 号 ， 身 份 证 号 ) 
< 一 拥有 一 [= 


[1 方案 3: 身份 证 信息 表 (身份 证 号 ， 发 证 单位 ， 教 工 号 ) 


和 了 全 方案 4 教 请 信息 表 伊 工 号 ，“， 身 份 证 号 ) 
实体 | ”上 ! 联系 1 实体 2 
wal 实体 2 表 ih 
实体 全 [飞信 7 Es ] 实 体 1 码 


图 12.16 1:1 联 系 的 转换 


@ 若 联系 为 1 : n, 也 有 两 种 转换 方式 : 一 是 将 1 : n 联系 转换 为 一 个 独立 的 关系 模 
式 , 联 系 名 为 关系 模式 名 ,与 该 联系 相连 的 各 实体 的 关键 字 及 联系 本 身 的 属性 为 关系 模式 
的 属性 ,关系 模式 的 关键 字 为 n 端 实 体 的 关键 字 ; 二 是 将 1 : n 联系 与 n 端 关系 合并 ,1 端 
的 关键 字 及 联系 的 属性 并 入 n 端的 关系 模式 即 可 。 和 转换 方法 及 具体 实例 如 图 12. 17 
所 示 。 

@ 车 联系 为 m : n, 关 系 模式 名 为 联系 名 ,与 该 联系 相连 的 各 实体 的 关键 字 及 联系 本 
身 的 属性 为 关系 模式 的 属性 ,关系 模式 的 关键 字 为 联系 中 各 实体 关键 字 的 并 集 。 转 换 方 
法 及 具体 实例 如 图 12. 18 所 示 。 
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二 方案 1: 隶属 1 表 (学 号 ,班级 编号 ) 
> 


2， 学 生 信息 表 (学 号 ，…， 班 9 
| CG 本 半生 生 信息 二 ，。 班 纺 号 


实体 上 联系 ! 下 实体 2 
| 实体 ? 表 ! 
Ei ] Ei 实 厅 1 硒 " 


图 12.17 1:n 联 系 的 转换 


二 人 成 绩 一》 学 生 选 课表 (学 号 ,课程 号 ,成 绩 ) 
廊 
课程 “| 一 (课程 号 > 

实体 ! | 联系 1 时 实体 2 
实体 ! 表 联系 ! 表 ee 
ES ESiSTENES: VES 


图 12.18 m:n 联系 的 转换 


@ 同一 实体 集 内 部 的 联系 ,可 将 该 实体 集 拆 分 为 相互 联系 的 两 个 子 集 ,然后 根据 它 
们 相互 间 不 同 的 联系 方式 (1 : 1,1 : n,m : n) 按 上 述 规则 处 理 。 

例如 ,企业 员工 实体 内 部 存在 领导 与 被 领导 的 1 : n 的 联系 , 则 将 其 与 员工 关系 模式 
合并 ,并 增加 一 个 “经 理 员工 号 ”属性 以 存放 经 理 的 员工 号 ,如 图 12. 19 所 示 。 


辐 C 一 一 >》 员工 (员工 号 , 姓名 , 工种 ,经 理 员 工 号 ) 


员工 


图 12.19 一 元 关系 的 转换 
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@ 三 个 或 三 个 以 上 实体 间 的 一 个 多 元 联系 可 以 转换 为 一 个 关系 模式 。 与 该 多 元 联 
系 相连 的 各 实体 的 码 以 及 联系 本 身 的 属性 均 转换 为 关系 的 属性 ,而 关系 的 码 为 各 实体 码 
的 组 合 。 

@ 具有 相同 码 的 关系 模式 可 合并 。 为 了 减少 系统 中 的 关系 个 数 ,如 果 两 个 关系 模式 
具有 相同 的 主 码 , 可 以 考虑 将 它们 合并 为 一 个 关系 模式 。 合 并 方法 是 将 其 中 一 个 关系 模 
式 的 全 部 属性 加 入 到 另 一 个 关系 模式 中 ,然后 去 掉 其 中 的 同 义 属性 (可 能 同名 也 可 能 不 同 
名 ) ,并 适当 调整 属性 的 次 序 。 

于 是 ,按照 上 述 E-R 图 的 转换 规则 将 例 9. 1 中 概念 模型 的 实体 及 关系 转换 为 关系 模 
型 ,转换 结果 如 下 。 

学 生 信 息 表 (学 号 ,姓名 ,性 别 ,出 生日 期 ,籍贯 ,民族 ,身份 证 号 ,班级 编号 ) 

教师 信息 表 ( 教 工 号 ,姓名 ,性 别 , 出 生日 期 ,籍贯 ,民族 ,身份 证 号 ,教研 室 名 称 ) 

课程 信息 表 ( 课 程 号 ,课程 名 称 ,学 时 数 , 学 分 数 , 先 修 课程 ) 

班级 表 (班级 编号 ,班级 名 称 ,班级 人 数 , 学 院 名 称 ) 

学 院 信息 表 ( 学 院 名 称 ,学 院 地 址 ) 

教研 室 信息 表 ( 教 研 室 名 称 ,教研 室 人 数 ,学 院 名称 ) 

身份 证 信息 表 ( 身 份 证 号 ,发 证 单位 ) 

学 生 选 课表 (学 号 ,课程 号 ,成 绩 ) 

教师 授课 表 ( 教 工 号 ,课程 号 ) 


12.5.2 数据 模型 的 优化 


数据 库 概 念 模型 的 转换 结果 并 不 是 唯一 的 ,为 了 提高 数据 库 应 用 系统 的 性 能 ,还 应 该 
对 所 得 的 关系 模型 进行 适当 的 修改 和 调整 ,这 就 是 数据 库 模型 优化 所 要 完成 的 工作 。 关 
系数 据 库 的 优化 通常 是 以 关系 模型 的 规范 化 理论 为 基础 的 。 

应 用 规范 化 理论 优化 逻辑 模型 一 般 要 做 如 下 5 项 工作 。 

(1) 确定 数据 依赖 。 如 果 需 求 分 析 阶 段 没有 来 得 及 做 ,可 以 现在 补 做 , 即 按 需 求 分 析 
阶段 所 得 到 的 语义 ,分 别 写 出 每 个 关系 模式 内 部 各 属性 之 间 的 数据 依赖 以 及 不 同 关系 模 
式 属性 之 间 的 数据 依赖 。 

(2) 对 于 各 个 关系 模式 之 间 的 数据 依赖 进行 极 小 化 处 理 , 消 除 宛 余 的 联系 。 

(3) 按照 数据 依赖 的 理论 对 关系 模式 逐一 进行 分 析 , 考 察 是 否 存 在 部 分 函数 依赖 、 传 
递 函 数 依赖 、 多 值 依赖 等 ,确定 各 关系 模式 分 别 属于 第 几 范 式 。 

(4) 按照 需求 分 析 阶 段 得 到 的 处 理 要 求 ,分 析 这 些 模 式 对 于 这 样 的 应 用 环境 是 否 合 
适 ,确定 是 否 要 对 某 些 模式 进行 合并 或 分 解 。 必 须 注意 的 是 ,并 不 是 规范 化 程度 越 高 的 关 
系 就 越 优 。 例 如 , 当 查 询 经 常 涉及 两 个 或 多 个 关系 模式 的 属性 时 ,系统 经 常 进行 连接 运 
算 。 连 接 运 算 的 代价 是 相当 高 的 ,可 以 说 关系 模型 低 效 的 主要 原因 就 是 连接 运算 引起 的 。 
这 时 可 以 考虑 将 这 几 个 关系 合并 为 一 个 关系 。 因 此 在 这 种 情况 下 ,第 二 范式 甚至 第 一 范 
式 也 许 是 合适 的 。 

又 如 , 非 BCNF 的 关系 模式 虽然 从 理论 上 分 析 会 存在 不 同 程度 的 更 新 异常 或 元 余 ， 
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但 如 果 在 实际 应 用 中 对 此 关系 模式 只 是 查询 ,并 不 执行 更 新 操作 , 则 就 不 会 产生 实际 影 
响 。 所 以 对 于 一 个 具体 应 用 来 说 ,到 底 规范 化 到 什么 程度 ,需要 权衡 响应 时 间 和 潜在 问题 


两 者 的 利 商 决 定 。 
(5) 对 关系 模式 进行 必要 的 分 解 , 提 高 数据 操作 的 效率 和 存储 空间 的 利用 率 。 常 用 
的 两 种 分 解 方法 是 水 平分 解 和 垂直 分 解 。 


人 水 平分 解 是 把 (基本 ) 关 系 的 元 组 分 为 若干 子 集合 ,定义 每 个 子 集合 为 一 个 子 关 
系 , 以 提高 系统 的 效率 。 

@ 垂直 分 解 是 把 关系 模式 R 的 属性 分 解 为 若干 子 集合 ,形成 若干 子 关 系 模式 。 

@ 规范 化 理论 为 数据 库 设 计 人 员 判 断 关 系 模式 的 优 劣 提供 了 理论 标准 ,可 用 来 预测 
模式 可 能 出 现 的 问题 ,使 数据 库 设 计 工作 有 了 严格 的 理论 基础 。 


12.5.3 数据库 逻辑 设计 案例 


下 面 是 学 生 图 书 借阅 管理 子 系统 的 设计 。 
1. 学 生 图 书 借阅 管理 子 系统 的 基本 需求 


该 子 系统 是 一 个 专 为 该 学 校 图 书馆 管理 而 设计 的 系统 。 读 者 从 图 书馆 借 书 ,对 图 书 
馆 来 说 ,读者 好 像 书籍 一 样 ,都 是 先 被 注册 在 该 系统 中 的 。 图 书馆 需要 处 理 新 买 的 图 书 ， 
包括 添加 、 删 除 等 。 图 书 管理 员 是 图 书馆 的 雇员 ,所 有 图 书 登记 \ 读 者 注册 的 工作 由 图 书 
管理 员 完 成 ,他 们 负责 和 读者 交互 ,该 系统 支持 他 的 工作 。 图 书馆 要 求 系统 能 方便 地 建 
立 、 更 新 和 删除 存在 该 系统 中 的 有 关 书 名 \ 读 者 等 信息 ,也 能 方便 地 登记 图 书 的 借 出 与 归 
还 等 的 信息 。 

2. 学 生 图 书 借阅 管理 子 系统 的 E-R 模型 设计 

(1) 根据 对 学 生 图 书 借阅 管理 系统 的 需求 管理 员 
分 析 , 可 以 先 得 到 实体 : 书 、 读 者 和 管理 员 。 


(2) 分 析 它 们 之 间 的 关系 ,管理 员 与 书 之 间 
存在 着 一 对 多 的 联系 ,联系 命名 为 登记”, 因为 


一 个 管理 员 可 以 负责 登记 多 本 图 书 ;管理 员 与 管理 员 登记 书 
读者 之 间 也 存在 一 对 多 的 联系 ,联系 命名 为 “ 注 

册 ”, 因 为 一 个 管理 员 可 以 负责 注册 多 名 读者 ; 入 库 时 间 

管理 员 .读者 、 书 之 间 存 在 多 对 多 的 借阅 联系 ， 

因为 一 名 读者 可 以 借阅 多 本 图 书 , 一 个 管理 员 书 

可 以 办 理 多 次 借阅 ,一 本 书 可 以 被 多 个 读者 借 


阅 。 至 此 ,三 个 实体 与 它们 之 间 的 联系 可 以 表 管理 员 
示 为 如 图 12. 20 所 示 。 

(3) 为 了 简化 E-R 图 ,假定 管理 员 的 属性 只 
有 职工 号 、 姓 名 、 性 别 、 权 限 级 别 , 读 者 的 属性 只 图 12.20 管理 员 , 学 生 , 书 三 个 实体 间 的 联系 
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有 借 书 证 号 、 姓 名 ,性别 、 系 别 。 书 的 属性 有 书号 、 书 名 、 作 者 、 出 版 社 \ 分 类 号 。 

(4) 再 分 析 每 一 个 实体 的 标识 符 。 假 定 管理 员 的 标识 符 是 职工 号 , 书 的 标识 符 是 书 
号 ,读者 的 标识 符 是 借 书证 号 。 

(5) 将 上 述 实 体 、 联 系 、 属 性 等 集成 ,得 到 学 生 图 书 借阅 管理 系统 完整 的 E-R 模型 图 
如 图 12. 21 所 示 。 


图 12.21 学 生 图 书 借阅 管理 子 系统 的 E-R 图 


3. E-R 模型 转换 为 关系 模型 


根据 实体 转换 规则 , 先 把 管理 员 、 书 、 读 者 实体 转换 关系 ,关系 模式 如 下 。 

管理 员 ( 职 工 号 ,姓名 ,性 别 ,权限 级 别 ) 

书 ( 书 号 , 书 名 ,作者 ,出 版 社 ,分 类 号 ) 

读者 ( 借 书 证 号 ,姓名 ,性 别 ,部 门 ) 

根据 1 :n 联系 的 转换 规则 ,把 联系 “登记 ”的 属性 即 “ 读 者 权限 ”和 管理 员 关 系 的 主键 
即 “ 职 工 号 ”加 入 到 读者 关系 中 ,得 到 读者 改进 后 的 关系 : 

读者 ( 借 书 证 号 ,姓名 ,性 别 ,部 门 ,读者 权限 ,职工 号 ) 

再 把 1 :nn 联系 “注册 ”的 属性 即 “ 入 库 时 间 ” 和 管理 员 关 系 的 主键 即 “ 职 工 号 ”加 入 到 
书 关系 中 ,得 到 书 改进 后 的 关系 : 

书 (书号 , 书 名 ,作者 ,出 版 社 , 分 类 号 ,入 库 时 间 , 职 工 号 ) 

将 一 个 三 元 关系 管理 员 、 书 和 读者 之 间 的 借阅 联系 转换 为 一 个 关系 : 

借阅 (职工 号 , 借 书 证 号 ,书号 , 借 出 日 期 ,归还 日 期 

所 以 最 终 得 到 的 关系 模型 为 : 

管理 员 ( 职 工 号 ,姓名 ,性 别 , 权 限 级 别 ) 

书 (书号 , 书 名 ,作者 ,出 版 社 ,分 类 号 ,入 库 时 间 , 职 工 号 ) 

读者 ( 借 书 证 号 ,姓名 ,性 别 ,部 门 , 读 者 权限 ,职工 号 ) 
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借阅 (职工 号 , 借 书 证 号 ,书号 , 借 出 日 期 ,归还 日 期 ) 

用 英文 命名 的 关系 模式 为 : 

Administrator(Ano, Aname, Asex, Aprivilege) 

BOOK (Bno,Bname, Bauthor, Bpublisher, BTPno, Indate, Ano) 
READER(Rno, Rname, Rsex, Rdept, Rprivilege, Ano) 
Borrow(Ano, Rno, Bno, Bdate, Rdate) 


12.6 数据库 的 物理 设计 


数据 库 逻 辑 设计 得 到 的 逻辑 模型 (或 逻辑 结构 ) 就 是 数据 库 的 模式 。 但 数据 库 最 终 是 
存储 在 物理 设备 上 的 ,数据库 在 物理 设备 上 的 存储 结构 和 存储 方式 称 为 数据 库 的 物理 结 
构 , 它 依赖 于 具体 的 DBMS。 

数据 库 的 物理 结构 设计 就 是 为 一 个 给 定数 据 库 的 逻辑 结构 选取 一 个 最 适合 应 用 环境 
的 物理 结构 和 存 取 方法 。 主 要 目标 是 对 数据 库 内 部 物理 结构 做 调整 并 选择 合理 的 存 取 路 
径 , 设 计 出 一 个 高 效 的 、 可 实现 的 物理 数据 库 结构 ,提高 数据 库 访问 速度 及 有 效 利用 存储 
空间 。 不 同 的 数据 库 管理 系统 提供 的 硬件 环境 和 存储 结构 、 存 取 方 法 不 同 , 提 供给 数据 库 
设计 者 的 系统 参数 以 及 变化 范围 也 不 同 ,因此 ,物理 结构 设计 一 般 没有 一 个 通用 的 准则 ， 
它 只 能 提供 一 个 技术 和 方法 作为 参考 。 


12.6.1 数据 库 物 理 设计 的 方法 


在 设计 数据 库 的 物理 结构 时 ,设计 者 首先 需要 充分 了 解 所 用 DBMS 的 功能 .性 能 、 特 
点 ,包括 所 提供 的 物理 环境 、 存 储 结构 、 存 取 方 法 ,确定 系统 配置 和 可 利用 的 工具 。 其 次 ， 
设计 者 还 需要 对 经 常用 到 的 查询 和 对 数据 进行 更 新 的 事物 进行 详细 的 分 析 , 获 得 物理 数 
据 库 设计 所 需 的 各 种 参数 。 

物理 设计 主要 包括 聚焦 设计 、 索 引 设计 和 分 区 设计 等 方法 。 索 引 方法 是 数据 库 中 经 
典 的 存 取 方 法 ,使 用 最 普遍 。 


1. 索引 设计 


根据 用 户 需求 确定 每 个 关系 是 否 需要 建立 索引 ,如 果 需 要 , 则 应 确定 在 该 关系 的 哪些 
属性 列 上 建立 索引 。 当 索引 属性 列 发 生变 化 或 增加 、 删 除 元 组 时 ,只 有 索引 发 生变 化 ,而 
关系 中 原先 元 组 的 存放 位 置 不 受 影响 。 每 个 关系 可 以 同时 建立 多 个 索引 。 

下 面 是 符合 建立 索引 的 条 件 。 

(1) 主 关键 字 及 外 关键 字 上 一 般 都 应 建立 索引 ,以 加 快 实体 间 的 连接 速度 ,有 助 于 引 
用 完整 性 检查 以 及 唯一 性 检查 。 

(2) 用 户 经 常 访 问 的 字段 上 应 建立 索引 。 

(3) 以 读 操 作为 主 的 关系 表 尽 可 能 多 地 建立 索引 。 

(4) 对 等 值 连接 查询 而 言 ,如 果 满 足 条 件 的 元 组 数量 小 则 可 以 考虑 在 有 关 属 性 上 建 


214 


数据 库 设 计 及 优化 


立 索 引 。 

(5) 有 些 查 询 可 从 索引 中 直接 得 到 结果 ,不 必 访 问 数 据 块 ,此 种 查询 可 建 索引 ,如 查 
询 某 属性 的 MIN, MAX,AVG,SUM,COUNT 等 函数 值 可 沿 该 属性 索引 的 顺序 集 扫描 
直接 求 得 结果 。 


2. 聚 签 设 计 


根据 用 户 需 求 确定 每 个 关系 是 否 需要 建立 聚 簇 ,如 果 需 要 , 则 应 确定 在 该 关系 的 哪些 
属性 列 上 建立 聚 徐 。 

聚 秘 是 将 有 关 的 数据 记录 集中 存放 在 一 个 物理 块 内 或 相 邻 物理 块 或 同一 柱 面 内 以 提 
高 查询 效率 ,在 目前 的 关系 型 DBMS 中 均 有 此 功能 。 聚 簇 一 般 至 少 定义 在 一 个 属性 之 
上 , 它 不 仅 适用 于 单个 关系 ,也 适用 于 多 个 关系 。 

聚 秘 功 能 可 以 大 大 提高 按 聚 篮 属 性 进行 查询 的 效率 ,但 是 对 于 与 聚 簇 属 性 无 关 的 访 
问 则 效果 不 佳 ,而 建立 聚 簇 开销 很 大 ,会 导致 关系 中 元 组 移动 其 物理 存储 位 置 , 并 使 此 关 
系 上 原 有 的 索引 无 效 而 必须 重建 。 当 一 个 元 组 的 聚 簇 码 发 生 改变 时 ,该 元 组 的 存储 位 置 
也 要 做 相应 移动 。 因 此 只 有 在 特定 情况 下 可 考虑 建立 聚 簇 。 

(1) 通过 聚 簇 访问 该 表 是 主要 的 ,与 聚 簇 无 关 的 其 他 访问 是 次 要 的 ,可 以 考虑 建立 
聚 徐 。 

(2) 聚 秘 属 性 的 对 应 数据 量 不 能 太 少 也 不 宜 过 大 , 太 少 效益 不 明显 ,而 太 大 则 要 对 盘 
区 采用 多 个 链接 块 ,对 提高 效率 不 利 。 

(3) 聚焦 属性 的 值 应 相对 稳定 以 减少 修改 聚 簇 所 引起 的 维护 开销 。 


3. 分 区 设计 


确定 数据 库 的 各 种 数据 的 存放 位 置 ,其 目的 还 是 提高 系统 性 能 。 数 据 库 中 的 数据 , 包 
括 关系 、 索 引 、 聚 簇 、 日 志 等 ,一 般 都 存放 在 磁盘 内 。 由 于 数据 量 的 增 大 ,往往 需要 用 到 多 
个 磁盘 驱动 器 或 磁盘 阵列 ,这 就 产生 了 磁盘 分 区 设计 问题 。 

分 区 设计 的 一 般 指导 性 原则 如 下 。 

(1) 减少 磁盘 访问 冲突 ,提高 1/O 并 行 性 。 

(2) 分 散热 点 数据 ,均衡 IO 负荷 。 

(3) 保证 关键 数据 快速 访问 ,缓解 系统 瓶颈 。 


12.6.2 确定 数据 库 的 物理 结构 

确定 数据 库存 储 结 构 , 即 确定 关系 索引、 聚焦 .日 志和 备份 等 数据 的 存储 安排 和 存储 
结构 ,确定 系统 配置 等 。 

1. 确定 数据 存放 位 置 和 存储 结构 的 因素 


要 综合 考虑 存 取 时 间 存储 空间 利用 率 和 维护 代价 三 个 方面 的 因素 。 这 三 个 方面 党 
常 是 相互 矛盾 的 ,例如 消除 一 切 元 余数 据 虽 然 能 够 节约 存储 空间 ,但 往往 会 导致 检索 代价 
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的 增加 ,因此 必须 进行 权衡 ,选择 一 个 折 中 方案 。 基 本 原则 是 根据 应 用 情况 进行 如 下 
处 理 。 

(1) 易 变 部 分 与 稳定 部 分 分 开 存放 。 

(2) 存 取 频率 较 高 部 分 与 存 取 频 率 较 低 部 分 分 开 存放 。 例 如 ,数据 库 数据 备份 、 日 志 
文件 备份 等 由 于 只 在 故障 恢复 时 才 使 用 ,而 且 数据 量 很 大 ,可 以 考虑 存放 在 磁带 上 。 

(3) 如 果 计 算 机 有 多 个 磁盘 或 磁盘 阵列 ,可 以 考虑 将 表 和 索引 分 别 放 在 不 同 的 磁盘 
上 ,在 查询 时 ,由 于 磁盘 驱动 器 并 行 工 作 , 可 以 提高 物理 1/O 读 写 的 效率 ,确定 数据 的 存 
放 位 置 。 

(4) 可 以 将 比较 大 的 表 分 别 放 在 两 个 磁盘 上 ,以 加 快 存 取 速 度 ,这 在 多 用 户 环境 下 特 
别 有 效 。 

(5) 可 以 将 日 志文 件 与 数据 库 对 象 ( 表 、 索 引 等 ) 放 在 不 同 的 磁盘 以 改进 系统 的 性 能 。 


2. 存储 分 配 参数 


DBMS 产品 一 般 都 提供 了 一 些 系 统 的 配置 变量 , 供 设计 人 员 和 数据 库 管理 员 进 行 物 
理 优化 。 参 数 变量 有 : 同时 使 用 数据 库 的 用 户 数 、 同 时 打开 的 数据 库 对 象 数 .内存 分 配 参 
数 、 使 用 的 缓冲 区 长 度 , 个 数 和 存储 分 配 参 数 等 。 在 初始 情况 下 ,系统 都 为 这 些 变 量 赋予 
了 合理 的 初 值 。 但 这 些 值 只 是 从 产品 本 身 特 性 出 发 ,不 一 定 能 适应 每 一 种 应 用 环境 ,在 进 
行 物理 设计 时 ,可 以 重新 对 这 些 变 量 赋值 以 改善 系统 的 性 能 。 


12.6.3 对 物理 结构 进行 评价 


数据 库 物 理 设计 过 程 中 需要 对 时 间 效 率 、 空 间 效 率 、 维 护 代价 和 各 种 用 户 要 求 进行 权 
衡 ,其 结果 可 以 产生 多 种 方案 ,数据 库 设计 人 员 必 须 对 这 些 方案 进行 细致 的 评价 ,从 中 选 
择 一 个 较 优 的 方案 作为 数据 库 的 物理 结构 。 

评价 物理 数据 库 的 方法 完全 依赖 于 所 选用 的 DBMS, 主 要 是 从 定量 估算 各 种 方案 的 
存储 空间 、 存 取 时 间 和 维护 代价 入 手 , 对 估算 结果 进行 权衡 .比较 ,选择 出 一 个 较 优 的 合理 
的 物理 结构 。 如 果 该 结构 不 符合 用 户 需 求 , 则 需要 修改 设计 。 


12.7 数据 库 的 实施 与 维护 

完成 数据 库 的 物理 设计 之 后 ,设计 人 员 就 要 用 DBMS 提供 的 数据 定义 语言 和 其 他 程 
序 将 数据 库 逻辑 设计 和 物理 设计 结果 严格 描述 出 来 ,成 为 DBMS 可 以 接受 的 源 代码 ,再 
经 过 调试 产生 目标 模式 。 
12.7.1 数据 库 的 实施 


数据 库 实施 主要 包括 以 下 工作 : 定义 数据 库 结构 ,数据 装载 ,编制 与 调试 应 用 程序 ， 
数据 库 试 运行 。 
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1. 定义 数据 库 结构 


确定 了 数据 库 的 逻辑 结构 与 物理 结构 后 ,就 可 以 用 所 选用 的 DBMS 提供 的 数据 定义 
语言 (DDL) 来 严格 描述 数据 库 结构 了 。 


2. 数据 装载 


数据 库 结 构建 立 好 后 ,就 可 以 向 数据 库 中 装载 数据 了 。 组 织 数据 入 库 是 数据 库 实 施 
阶段 最 主要 的 工作 。 对 于 数据 量 不 是 很 大 的 小 型 系统 ,可 以 用 人 工 方法 完成 数据 的 入 库 ， 
其 步骤 如 下 。 

1) 筛选 数据 

需要 装 人 数据 库 中 的 数据 通常 都 分 散在 各 个 部 门 的 数据 文件 或 原始 凭证 中 ,所 以 首 
先 必须 把 需要 入 库 的 数据 筛选 出 来 。 

2) 转换 数据 格式 

筛选 出 来 的 需要 入 库 的 数据 ,其 格式 往往 不 符合 数据 库 要求 ,还 需要 进行 转换 。 这 种 
转换 有 时 可 能 很 复杂 。 

3) 输入 数据 

将 转换 好 的 数据 输入 计算 机 中 。 

4) 校 验 数据 

检查 输入 的 数据 是 否 有 误 。 

对 于 中 大 型 系统 来 说 ,由 于 数据 量 极 大 ,用 人 工 方式 组 织 数据 入 库 将 会 耗费 大 量 人 力 
和 物力 ,而 且 很 难保 证 数据 的 正确 性 。 因 此 应 该 设计 一 个 数据 输入 子 系统 ,由 计算 机 辅助 
数据 的 入 库 工 作 。 


3. 编制 与 调试 应 用 程序 


在 数据 库 实 施 阶段 , 当 数据 库 结构 建立 好 后 ,就 可 以 开始 编制 与 调试 数据 库 的 应 用 程 
序 。 也 就 是 说 ,编制 与 调试 应 用 程序 是 与 组 织 数据 入 库 同步 进行 的 。 在 调试 应 用 程序 时 ， 
由 于 数据 入 库 尚未 完成 ,可 先 使 用 模拟 数据 。 


4. 数据 库 试 运行 


应 用 程序 调试 完成 ,并 且 已 有 一 小 部 分 数据 入 库 后 ,就 可 以 开始 数据 库 的 试 运行 。 数 
据 库 试 运行 也 称 为 联合 调试 ,其 主要 工作 如 下 。 

(1) 功能 测试 : 实际 运行 数据 库 应 用 程序 ,对 数据 库 执行 各 种 操作 ,测试 应 用 程序 的 功 
能 是 否 满足 要 求 。 如 果 不 满 足 , 则 要 对 应 用 程序 进行 修改 ,调整 ,直到 达到 设计 要 求 为 止 。 

(2) 性 能 测试 : 测量 系统 的 性 能 指标 ,分 析 其 是 否 达到 设计 目标 。 在 对 数据 库 进 行 
物理 结构 设计 时 已 经 初步 确定 了 系统 的 物理 参数 ,但 一 般 情况 下 ,设计 时 在 很 多 方面 只 是 
一 个 近似 的 估计 ,和 实际 系统 的 运行 还 有 一 定 的 差距 。 因 此 必须 在 试 运行 阶段 实际 测量 
和 评价 系统 的 性 能 指标 ,分 析 是 否 符合 设计 要 求 。 事 实 上 ,有 些 参 数 的 最 佳 值 往往 是 经 过 
调试 后 找到 的 。 
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如 果 测 试 的 结果 不 符合 设计 目标 , 则 需要 返回 物理 结构 设计 阶段 ,重新 调整 物理 结 
构 ,修改 系统 参数 。 有 时 甚至 要 返回 逻辑 设计 阶段 ,修改 逻辑 结构 。 由 于 重新 设计 数据 库 
的 物理 结构 甚至 逻辑 结构 ,会 导致 数据 重新 人 库 ,而 人 库 的 数据 量 巨大 ,因此 应 分 期 分 批 
地 组 织 数据 入 库 , 先 输入 小 批量 数据 做 调试 。 试 运行 基本 合格 后 ,再 大 批量 输入 数据 , 逐 
步 增加 数据 量 完成 运行 评价 ,以 减少 工作 浪费 。 

另外 , 试 运行 阶段 的 数据 库 还 不 稳定 , 软 、 硬 件 故障 随时 都 可 能 发 生 , 而 且 系统 的 操作 
人 员 对 系统 也 还 不 熟悉 , 误 操作 不 可 避免 ,因此 应 该 首先 调试 运行 DBMS 的 恢复 功能 ,做 
好 数据 库 的 备份 转 储 和 恢复 工作 ,一 旦 出 现 故障 ,可 以 尽快 地 恢复 数据 库 , 尽 量 减 少 对 数 
据 库 的 破坏 。 


12.7.2 数据 库 的 维护 


数据 库 试 运行 结果 符合 设计 和 目标 后 ,数据 库 就 可 以 真正 投入 运行 了 。 数 据 库 投 入 
运行 标志 着 开发 任务 的 基本 完成 和 维护 工作 的 开始 ,并 不 意味 着 设计 过 程 的 终结 。 由 于 
应 用 环境 在 不 断 变化 ,数据 库 和 运行 过 程 中 物理 存储 也 会 不 断 变化 ,对 数据 库 设计 进行 评 
价 .调整 和 修改 等 维护 工作 是 一 个 长 期 的 任务 ,也 是 设计 工作 的 继续 和 提高 。 

在 数据 库 运行 阶段 ,对 数据 库 经 常 性 的 维护 工作 主要 是 由 数据 库 管理 员 完 成 的 ,包括 
以 下 内 容 。 


1. 数据 库 的 转 储 和 恢复 


定期 对 数据 库 和 日 志文 件 进行 备份 ,以 保证 一 旦 发 生 故 障 , 能 利用 数据 库 备份 及 日 志 
文件 备份 ,尽快 将 数据 库 恢复 到 某 种 一 致 性 状态 ,并 尽 可 能 减少 对 数据 库 的 破坏 。 


2. 数据 库 的 安全 性 、 完 整 性 控制 


数据 库 管 理 员 必须 对 数据 库 安 全 性 和 完整 性 控制 负 起 责任 。 根 据 用 户 的 实际 需要 授 
了 予 不 同 的 操作 权限 。 另 外 ,由 于 应 用 环境 的 变化 ,数据 库 的 完整 性 约束 条 件 也 会 变化 ,也 
需要 数据 库 管理 员 不 断 修正 ,以 满足 用 户 要 求 。 


3. 数据 库 性 能 的 监督 .分析 和 改进 


目前 许多 DBMS 产品 都 提供 了 监测 系统 性 能 参数 的 工具 ,数据 库 管理 员 可 以 利用 这 
些 工 具 方 便 地 得 到 系统 运行 过 程 中 一 系列 性 能 参数 的 值 。 

数据 库 管 理 员 应 该 仔细 分 析 这 些 数据 ,通过 调整 某 些 参数 来 进一步 改进 数据 库 性 能 。 

4. 数据 库 的 重组 织 和 重 构造 

数据 库 运行 一 段 时 间 后 ,由 于 对 记录 不 断 进行 增 、 删 \ 改 的 操作 ,会 使 数据 库 的 物理 存 
储 性 能 降低 ,从 而 降低 数据 库存 储 空间 的 利用 率 和 数据 的 存 取 效率 ,使 数据 库 的 性 能 下 


降 。 这 时 数据 库 管理 员 就 要 对 数据 库 进行 重组 织 或 部 分 重组 织 ( 只 对 频繁 增 、 删 的 表 进 行 
重组 织 )。 数 据 库 的 重组 织 不 会 改变 原 设计 数据 的 逻辑 结构 和 物理 结构 ,只 是 按 原 设计 要 
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求 重新 安排 存储 位 置 ,回收 垃圾 ,减少 指针 链 ,提高 系统 性 能 。DBMS 一 般 都 提供 了 供 重 
组 织 数据 库 使 用 的 实用 程序 ,帮助 数据 库 管理 员 重 新 组 织 数 据 库 。 

当 数 据 库 应 用 环境 发 生变 化 时 ,将 导致 实体 及 实体 间 的 联系 也 发 生 相应 的 变化 ,使 原 
有 的 数据 库 设 计 不 能 很 好 地 满足 新 的 需求 ,从 而 不 得 不 适当 调整 数据 库 的 模式 和 内 模式 ， 
这 就 是 数据 库 的 重 构造 。DBMS 一 般 都 提供 了 修改 数据 库 结构 的 功能 。 

重 构造 数据 库 的 程度 是 有 限 的 。 若 应 用 变化 太 大 ,已 无 法 通过 重 构 数据 库 来 满足 新 
的 需求 ,或 重 构 数 据 库 的 代价 太 大 , 则 表明 现 有 的 数据 库 应 用 系统 的 生命 周期 已 经 结束 ， 
应 该 重新 设计 新 的 数据 库 系统 ,开始 新 数据 库 应 用 系统 的 生命 周期 。 


小 结 


本 章 主要 介绍 了 数据 库 设 计 的 全 过 程 , 给 出 了 其 中 的 重要 方法 和 基本 步骤 ,详细 描述 
了 数据 库 设计 各 个 阶段 : 需求 分 析 、 概 念 结构 设计 、 人 逻辑 结构 设计 ,物理 结构 设计 数据库 
实施 .数据 库 运 行 和 维护 6 个 阶段 。 本 章 的 重点 是 数据 库 结构 的 概念 结构 设计 和 逮 辑 结 
构 设计 。 

(1) 数据 库 设 计 的 6 个 阶段 : 需求 分 析 、 概 念 结构 设计 、 罗 辑 结构 设计 、 物 理 结构 设 
计数 据 库 实施 和 数据 库 的 运行 与 维护 。 

(2) 需求 分 析 , 使 用 数据 字典 汇总 各 类 数据 : 数据 项 数据 结构 ,数据 流 、 数 据 存 储 和 

(3) 概念 结构 设计 ,是 整个 数据 库 设计 的 关键 , 它 通过 对 用 户 需求 进行 综合 .归纳 与 
抽象 ,形成 一 个 独立 于 具体 DBMS 的 概念 模型 ,基本 表示 方法 是 使 用 E-R 图 。 

(4) 逻辑 结构 设计 ,是 将 概念 结构 转换 为 某 个 DBMS 所 支持 的 数据 模型 ,并 对 其 进 
行 优化 。 

(5) 物理 设计 ,为 逻辑 数据 模型 选取 一 个 最 适合 应 用 环境 的 物理 结构 (包括 存储 结构 
和 存 取 方法 )。 

(6) 实施 阶段 ,设计 人 员 运 用 DBMS 提供 的 数据 语言 及 其 宿主 语言 ,建立 数据 库 , 编 
制 与 调试 程序 ,组 织 数据 入 库 ,并 进行 试 运行 。 

(7) 运行 和 维护 阶段 ,数据 库 应 用 系统 经 过 试 运行 后 即 可 投入 正式 运行 , 重 构 , 重 
组 织 。 

(8) 关系 模式 规范 化 的 必要 性 : 关系 模式 的 宛 余 和 异常 问题 。 

(9) 数据 依赖 是 关系 数据 库 设计 的 中 心 问题 ,在 规范 化 部 分 介绍 了 重要 的 形式 函数 
依赖 : 部 分 函数 依赖 .完全 函数 依赖 .传递 依赖 等 。 

(10) 1NF、2NF、3NF 的 定义 及 模式 分 解 。 


习题 


12.1 试 述 数据 库 设计 过 程 。 
12.2 什么 是 数据 库 概念 设计 ? 论述 概念 结构 设计 的 特点 和 方法 。 
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12.3 简 述 关系 模式 优化 的 主要 步骤 。 

12.4 学 生 选 课 子 系统 用 于 学 生 选 课 注 册 管 理 和 学 生成 绩 管 理 。 假 定 某 学 校 具 有 一 
种 类 型 的 学 生 ,学 生 注册 时 提供 包括 学 生 的 姓名 性别、 籍贯 .年 龄 .身份 证 号 码 . 人 学 年 
月 ,家 庭 住址 .父母 姓名 、 联 系 电话 等 基本 情况 ,注册 成 功 后 ,每 一 个 学 生 有 唯一 的 一 个 学 
号 。 学 校 中 已 经 开设 多 门 课程 ,每 门 课程 有 唯一 的 课程 编号 ,并 且 还 有 课程 名 称 、 课 程 简 
介 、 学 分 等 情况 。 学 期 初 ,每 个 学 生 可 以 选修 若干 门 课程 ,每 门 选 修 课 程 可 以 有 多 个 学 生 
选修 。 请 用 E-R 图 画 出 该 系统 ,然后 将 E-R 模型 转换 为 关系 模型 。 

12.5 试 根据 图 12. 22 的 内 容 , 设 计 交 通 违章 处 罚 数 据 库 的 E-R 图 并 转换 为 关系 模 
式 。 注 意 ,一 张 违章 单 可 能 有 多 种 处 罚 。 


交通 违章 通知 书 
通知 书 编号 ，TZ11719 
姓名 : xxx 
驾驶 执照 号 ，xxxxxx 


地 址 ，xxxxxxxxxx 
邮编 ，xxxxxx 


电话 : xxxxxx 


机 动车 牌照 号 ，xxxxxx 
型 号 ，xxxxxx 


制造 厂 ，xxxxxx 


生产 日 期 : xxxxxx 


违章 日 期 ，xxxxxx 


时 间 :， xxxxxx 
地 点 : xxxxxx 
违章 记载 ， xxxxxx 
处 罚 方式 


警告 口 


罚款 ”加 
暂 扣 驾 驶 执照 


警察 编号 ，xxx 
被 处 罚 人 签字 : xxx 


XXX 


图 12. 22 交通 违章 通知 书 的 内 容 
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第 13 章 ”数据 库 安全 性 与 完整 性 


本 章 学 习 目标 

。 掌握 DBMS 安全 性 保护 的 基本 原理 与 方法 ,并 能 熟练 运用 SQL 中 的 GRANT 和 
REVOKE 语句 进行 授权 。 

。 掌握 DBMS 完整 性 约束 的 保证 措施 ,并 能 熟练 运用 SQL 语句 定义 完整 性 约束 
条 件 。 

。 掌握 数据 库 编程 中 的 游标 概念 及 其 使 用 方法 。 

。 理解 使 用 存储 过 程 编写 复杂 的 业务 处 理 和 查询 统计 功能 。 

。 了解 如 何 使 用 触发 器 实现 复杂 的 安全 性 保护 和 完整 性 约束 。 


本 章 主 要 介绍 数据 库 的 完整 性 约束 ,安全 性 约束 以 及 相应 的 数据 库 编程 技术 。 数 据 
库 的 安全 性 是 指 保护 数据 库 以 防止 不 合法 使 用 所 造成 的 数据 泄密 、 更 改 或 破坏 ;数据 库 的 
完整 性 是 指 防 止 数 据 库 中 存在 不 符合 语义 的 数据 ,其 防范 对 象 是 不 合 语义 的 不 正确 的 数 
据 。 前 面 章 节 中 学 习 的 标准 SQL 是 通用 的 查询 和 执行 语言 ,但 在 实际 编程 中 功能 并 不 全 
面 。 本 章 将 介绍 的 Transact-SQL 对 SQL 的 功能 做 了 很 大 扩展 ,利用 这 些 扩 展 功 能 ,用 户 
可 以 编写 出 更 复杂 的 语句 ,如 游标 、 存 储 过 程 和 触发 器 等 ,从 而 方便 用 户 直 接 完成 应 用 程 
序 的 开发 ,用 于 加 强 数 据 的 安全 性 、 完 整 性 约束 和 业务 规则 等 。 


13.1 数据 库 安 全 性 


安全 性 问题 不 是 数据 库 系统 所 独 有 的 ,所 有 计算 机 系统 都 有 这 个 问题 。 只 是 数据 库 
系统 中 大 量 数据 集中 存放 , 且 为 许多 最 终 用 户 直接 共享 ,从 而 使 安全 性 问题 更 为 突出 。 企 
业 的 资产 需要 受到 保护 ,特别 是 包含 企业 重要 信息 的 数据 库 。 安 全 性 是 评价 一 个 数据 库 
系统 的 重要 指标 。 目 前 所 有 的 技术 中 ,没有 任何 一 种 技术 像 数据 库 这 样 受到 持续 的 审核 
和 攻击 。 对 数据 的 威胁 比 黑客 的 威胁 更 可 怕 。 公 司 需 要 审核 打包 的 或 定制 应 用 的 安全 设 
置 。 数 据 库 管理 员 需 要 对 可 能 操作 服务 器 的 个 体 进行 细 粒 度 控制 。 这 个 个 体 既 包括 应 
用 ,也 包括 开发 人 员 和 数据 分 析 师 。 


13.1.1 数据 库 安 全 的 基本 概念 
数据 库 安 全 保护 的 目标 是 确保 只 有 授权 用 户 才 能 访问 数据 库 , 未 被 授权 的 人 员 则 无 


法 接近 数据 。 通 常 ,安全 措施 是 指 计算 机 系统 中 用 户 直接 或 通过 应 用 程序 访问 数据 库 所 
要 经 过 的 安全 认证 过 程 。 数 据 库 安全 认证 过 程 如 图 13. 1 所 示 。 
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用 户 人 一 DBMS [一 操作 系统 数据 库 


用 户 标识 与 鉴别 ”数据 库 安全 保护 操作 系统 安全 保护 数据 密码 存储 


图 13.1 数据 库 安 全 认证 过 程 


1. 用 户 标识 与 鉴别 


当 用 户 访问 数据 库 时 ,要 求 先 将 其 用 户 名 (User Name) 口令 与 密码 (Password) 提交 
给 数据 库 管理 系统 进行 认证 。 只 有 在 确定 其 身份 合法 后 ,才能 进入 数据 库 进行 数据 存 取 
操作 。 当 用 户 对 数据 库 执行 操作 时 ,系统 自动 检查 用 户 是 否 有 权限 执行 这 些 操作 。 


2. 数据 库 安 全 保护 


身份 认证 是 安全 保护 的 第 一 步 。 通 过 身份 认证 的 用 户 ,只 是 拥有 了 进入 数据 库 的 “ 凭 
证 ”, 而 用 户 在 数据 库 中 可 以 执行 什么 操作 ,还 需 通 过 “ 存 取 控制 ”或 视图 进行 权限 分 配 。 

(1) 存 取 控制 : 决定 用 户 可 以 对 数据 库 中 的 哪些 对 象 进行 操作 ,进行 何 种 操作 。 存 
取 控 制 机 制 主要 包括 以 下 两 部 分 。 

中 定义 用 户 权 限 及 将 用 户 权限 登记 到 数据 字典 中 。 

@ 合法 权限 检查 : 当 用 户 发 出 存 取 数据 库 的 操作 请 求 后 ,DBMS 查找 数据 字典 并 根 
据 安 全 规则 进行 合法 权限 检查 , 若 用 户 的 操作 请 求 超出 了 定义 的 权限 ,系统 将 拒绝 执行 此 
操作 。 

(2) 视图 : 可 以 通过 为 不 同 的 用 户 定义 不 同 的 视图 ,达到 限制 用 户 访问 范围 的 目的 。 
视图 机 制 能 隐藏 用 户 无 权 存 取 的 数据 ,从 而 自动 地 对 数据 库 提供 一 定 程度 的 安全 保护 。 

但 是 ,视图 的 主要 功能 在 于 提供 数据 库 的 逻辑 独立 性 ,其 安全 性 保护 不 太 精 细 , 往 往 
不 能 达到 应 用 系统 的 要 求 , 因 此 在 实际 应 用 中 ,通常 将 视图 机 制 与 存 取 控制 机 制 结合 起 来 
使 用 ,如 先 通 过 视图 屏蔽 一 部 分 保密 数据 ,然后 进一步 定义 存 取 权 限 。 

(3) 审计 : 审计 是 一 种 监视 措施 ,用 于 跟踪 并 记录 有 关 数 据 的 访问 活动 。 审 计 和 追踪 
把 用 户 对 数据 库 的 所 有 操作 自动 记录 下 来 ,存放 在 审计 日 志 中 。 审 计 日 志 的 内 容 一 般 包 
括 : 操作 类 型 (如 修改 查询、 删除 ) ,操作 终端 标识 与 操作 者 标识 ,操作 日 期 和 时 间 ,操作 
所 涉及 的 相关 数据 (如 基本 表 、 视 图 .记录 、 属 性 等 ) ,数据 库 的 前 映像 ( 即 修改 前 的 值 ) 和 后 
映像 ( 即 修 改 后 的 值 ) 等 。 利 用 这 些 信息 , 可 找 出 非法 存 取 数据 库 的 人 、 时 间 和 内 容 等 。 数 
据 库 管理 系统 往往 将 审计 作为 可 选 特征 ,允许 操作 者 打开 或 关闭 审计 功能 。 


3. 操作 系统 安全 保护 


通过 操作 系统 提供 的 安全 措施 来 保证 数据 库 的 安全 性 。 在 用 户 使 用 客户 计算 机 通过 
网 络 实现 数据 库 服务 器 的 访问 时 ,用 户 首先 要 获得 计算 机 操作 系统 的 使 用 权 。 一 般 来 说 ， 
在 能 够 实现 网 络 互联 的 前 提 下 ,用户 没有 必要 向 运行 数据 库 服 务 器 的 主机 进行 登录 ,除非 
数据 库 服务 器 就 运行 在 本 地 计算 机 上 。 数 据 库 管 理 系统 可 以 直接 访问 网 络 端口 ,所 以 可 
以 实现 对 操作 系统 安全 体系 以 外 的 服务 器 及 其 数据 库 的 访问 。 保 护 操作 系统 的 安全 性 是 
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操作 系统 管理 员 或 者 网 络 管理 员 的 任务 。 由 于 数据 库 管理 系统 采用 了 集成 操作 系统 网 络 
安全 性 机 制 ,所 以 使 得 操作 系统 安全 性 的 地 位 得 到 提高 ,但 同时 也 加 大 了 管理 数据 库 系统 
安全 性 的 灵活 性 和 难度 。 


4. 数据 密码 存储 


访问 控制 和 存 取 控制 可 将 用 户 的 应 用 系统 访问 范围 最 小 化 和 数据 对 象 操作 权限 最 低 
化 ,但 对 一 些 敏感 数据 进行 "加密 存储 ?也 是 数据 库 管理 系统 提供 的 安全 策略 。 

数据 加 密 是 防止 数据 库 中 数据 存储 和 传输 失 密 的 有 效 手段 。 加 密 的 基本 思想 是 先 根 
据 一 定 的 算法 将 原始 数据 即 明文 (Plaintext) 加 密 为 不 可 直接 识别 的 格式 即 密 文 
(Ciphertext) ,然后 数据 以 密 文 的 方式 存储 和 传输 。 


13.1.2 用 户 管理 


数据 库 用 户 有 以 下 几 种 。 

(1) dbo 用 户 : 数据 库 拥 有 者 或 数据 库 创 建 者 。dbo 在 其 所 拥有 的 数据 库 中 拥有 所 
有 的 操作 权限 。dbo 的 身份 可 被 重新 分 配给 另 一 个 用 户 , 系 统管 理 员 sa 可 作为 其 所 管理 
的 任何 数据 库 的 dbo 用 户 。 

(2) guest 用 户 : 如 果 guest 用 户 在 数据 库 中 存在 , 则 允许 任意 一 个 登录 用 户 作为 
guest 用 户 访 问 数据 库 , 其 中 包括 那些 不 是 数据 库 用 户 的 SQL 服务 器 用 户 。 除 系统 数据 
库 master 和 临时 数据 库 tempdb 的 guest 用 户 不 能 被 删除 外 ,其 他 数据 库 都 可 以 将 自己 
的 guest 用 户 删 除 ,以 防止 非 数 据 库 用 户 的 登录 用 户 对 数据 库 进 行 访问 。 

(3) 新 建 的 数据 库 用 户 : 用 户 可 根据 实际 需要 创建 不 同 权限 的 数据 库 用 户 。 

用 户 权限 是 由 两 个 要 素 组 成 的 : 数据 对 象 和 操作 类 型 。 用 户 可 以 在 哪些 数据 对 象 上 
进行 哪些 类 型 的 操作 ,这 个 定义 存 取 权 限 的 过 程 称 为 授权 。GRANT 和 REVOKE 语句 
向 用 户 授予 或 收回 对 数据 的 操作 权限 ,对 数据 库 模式 的 授权 由 DBA 在 创建 用 户 时 实现 。 


1. 创建 用 户 
创建 用 户 的 语法 如 下 。 


CREATE USER <username> 
[WITH] [DBA | RESOURCE | CONNECT] 


只 有 系统 的 超级 用 户 才 有 权限 创建 一 个 新 的 数据 库 用 户 ,但 该 语法 在 SQL Server 数 
据 库 中 不 支持 。 


2. 权限 的 授予 与 收回 


GRANT 和 REVOKE 有 两 种 权限 : 目标 权限 和 命令 权限 。 
(1) 命令 权限 的 授予 与 收回 。 主 要 指 DDL 操作 权限 ,语法 分 别 为 : 


GRANT {all | <command list>} TO {public | <username list>} 
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REVOKE {all | <command list>} FROM {public | <username list>} 


其 中 ， 

@ 二 command_ list 之 可 以 是 create database、 create default、 create function create 
procedure create rule create table .create view create index、backup database 和 backup log 等 。 

G@ 一 次 可 授予 多 种 权限 ,授予 多 种 权限 时 ,权限 之 间 用 逗号 分 隔 。 如 果 具 有 创建 对 
象 的 create 权限 , 则 自动 具有 其 创建 对 象 的 修改 权限 alter 和 删除 权限 drop。 对 于 基本 
表 , 自 动 具有 在 所 创建 表 上 创建 .删除 和 修改 触发 器 的 权限 。 修 改 权 限 alter 和 删除 权限 
drop 不 额外 授权 。 

@ all: 表示 上 述 所 有 权限 。 

@ public: 表示 所 有 的 用 户 。 

@ 二 username_list 记 : 指定 的 用 户 名 列表 。 如 果 将 某 组 权限 同时 授予 多 个 用 户 , 则 
用 户 名 之 间 用 逗号 分 隔 。 

【 例 13.1】 将 创建 表 和 视图 的 权限 授予 ul 和 u2 用 户 。 

GRANT create table, create view TO ul, u2 

【 例 13.2】 从 u2 收回 创建 视图 的 权限 。 

REVOKE create view FROM u2 


(2) 目标 权限 的 授予 和 收回 。 主 要 指 DML 操作 权限 ,语法 分 别 如 下 。 


GRANT {all | <command list>} ON <objectName> [(<columnName list>)] 
TO {public | <username list>} [WITH GRANT OPTION] 

REVOKE {all | <command list>} ON <objectName> [(<columnName list >)] 
FROM {public | <username list>} [CASCADE | RESTRICT] 


其 中 ， 

@ 二 command_list 记 可 以 是 update、select、insert、delete、excute 和 all。excute 针对 
存储 过 程 授予 执行 权限 ,update、select、insert、delete 针对 基本 表 和 视图 授权 ,all 表示 所 
有 的 权限 。 

@ 对 象 的 创建 者 自动 拥有 该 对 象 的 插入 、 删 除 .更 新 和 查询 操作 权限 ;过程 的 创建 者 
自动 拥有 所 创建 过 程 的 执行 权限 。 

@@ CASCADE: 级 联 收 回 。 

由 RESTRICT: 默认 值 ,车 转 赋 了 权限 , 则 不 能 收回 。 

@ WITH GRANT OPTION: 允许 将 指定 对 象 上 的 目标 权限 授予 其 他 安全 账户 。 
但 是 不 允许 循环 授权 , 即 不 允许 将 得 到 的 权限 授予 其 祖先 。 

【 例 13.3】 将 对 课程 表 Course 的 查询 ,插入 权限 授予 用 户 ul , 且 用 户 ul 可 以 转 授 
其 所 获得 的 权限 给 其 他 用 户 。 


GRANT select, insert ON Course TO ul WITH GRANT OPTION 


【 例 13.4】 ul 将 对 课程 表 Course 的 查询 ,插入 权限 转 授 给 用 户 u2, 且 用 户 u2 不 可 
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以 转 授 其 所 获得 的 权限 给 其 他 用 户 。 
GRANT select, insert ON Course TO u2 


【 例 13. 5】 将 对 学 生 表 Student 的 性 别 .出 生日 期 的 查询 和 修改 权限 授予 用 户 u3 和 
u4, 且 不 可 以 转 授权 限 。 


GRANT select, update ON Student (sex, birthday) TO u3,u4 


如 果 是 对 列 授予 权限 ,命令 项 可 以 包括 select 或 update 或 两 者 组 合 ; 若 使 用 了 select * , 则 
必须 对 表 的 所 有 列 赋予 select 权限 。 
【 例 13. 6】 将 用 户 ul 对 课程 表 Course 的 查询 和 插入 权限 收回 。 


REVOKE select, insert ON Course FROM ul CASCADE 


本 例 必须 级 联 收 回 ,因为 ul 将 该 表 的 查询 和 插入 权限 转 授 给 了 u2。 
【 例 13.7】 将 用 户 u3,u4 对 表 Student 的 查询 权限 收回 。 


REVOKE select ON Student FROM u3, u4 


13.1.3 角色 管理 


数据 库 角 色 是 被 命名 的 一 组 与 数据 库 操 作 相 关 的 权限 。 角 色 是 权限 的 集合 ,可 以 为 
一 组 具有 相同 权限 的 用 户 创 建 一 个 角色 。 角 色 用 来 简化 将 很 多 权限 分 配给 用 户 这 一 复杂 
任务 的 管理 。 用 户 可 以 使 用 系统 自 带 的 角色 ,也 可 以 创建 一 个 代表 一 组 用 户 使 用 的 权限 
角色 ,然后 把 这 个 角色 分 配给 这 个 工作 组 的 用 户 。 一 般 来 说 ,角色 是 为 特定 的 工作 组 或 者 
任务 分 类 而 设置 的 ,用 户 可 以 根据 自己 所 执行 的 任务 成 为 一 个 或 多 个 角色 的 成 员 。 当 然 
用 户 可 以 不 必 是 任何 角色 的 成 员 ,也 可 以 为 用 户 分 配 个 人 权限 。 

用 户 自 定 义 的 数据 库 角 色 有 两 种 类 型 : 标准 角色 和 应 用 程序 角色 。 

(1) 标准 角色 通过 对 用 户 权限 等 级 的 认定 而 将 用 户 划 分 为 不 同 的 用 户 组 ,用 户 属于 
一 个 或 多 个 角色 ,从 而 实现 管理 的 安全 性 。 

(2) 应 用 程序 角色 是 一 种 比较 特殊 的 角色 。 当 我 们 打算 让 某 些 用 户 只 能 通过 特定 的 
应 用 程序 间接 地 存 取 数据 库 中 的 数据 而 不 是 直接 地 存 取 数据 库 中 的 数据 时 ,就 应 该 考虑 
使 用 应 用 程序 角色 。 当 某 一 用 户 使 用 了 应 用 程序 角色 时 ,他 便 放弃 了 已 被 赋予 的 所 有 数 
据 库 专 有 权限 ,他 所 拥有 的 只 是 应 用 程序 角色 被 设置 的 角色 。 

角色 的 创建 ,授权 、 转 授 和 收回 语句 的 语法 如 下 。 

(1) 角色 的 创建 ,在 SQL Server 数据 库 中 ,使 用 系统 存储 过 程 sp_addrole 创建 角色 ， 
其 语法 为 ， 


sp_addrole <roleName> 


(2) 给 角色 授权 : 


GRANT {all | <command list>} ON <objectName>TO <roleName list> 
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(3) 将 角色 授予 其 他 的 角色 或 用 户 : 


GRANT <roleName list>TO <roleName list>| <username list> 


[WITH ADMIN OPTION] 
(4) 角色 权限 的 收回 : 
REVOKE {all | <command list>} ON <objectName>FROM <roleName list> 
(5) 从 角色 或 用 户 中 收回 角色 : 
REVOKE <roleName>FROM {<roleName list>| <username list>} 


【 例 13.8】 通过 角色 实现 将 一 组 权限 授予 一 个 用 户 。 
(1) 创建 一 个 角色 R1。 


sp_addrole R1 
(2) 使 用 GRANT 语句 ,使 角色 R1 拥有 Student 表 的 select\update insert 权限 。 
GRANT select, update, insert ON Student TO R1 

(3) 将 角色 R1 授予 用 户 ul、u2 和 u3 ,使 他 们 具有 角色 R1 所 包含 的 全 部 权限 。 
GRANT R1 TO ul, u2, u3 

(4) 通过 角色 R1 可 以 一 次 性 地 收回 已 授予 用 户 ul 的 这 三 个 权限 。 

REVOKE R1 FROM ul 

【 例 13.9】 将 对 表 Student 的 删除 权限 授予 角色 R1, 并 收回 查询 权限 。 


GRANT delete ON Student TO R1 
REVOKE select ON Student FROM R1 


通过 修改 角色 的 权限 ,一 次 性 地 将 用 户 u2 和 u3 的 权限 全 部 修改 了 。 


13.2 数据库 完 整 性 


当 操作 表 中 数据 时 ,由 于 种 种 原因 ,经 常会 遇 到 一 些 问题 。 比 如 , 某 个 公司 中 员工 的 
姓名 有 可 能 是 重复 的 ,但 是 员工 的 编号 是 不 会 重复 的 ,可 是 因为 人 力 资源 部 门 的 工作 人 员 
工作 朴 忽 , 某 个 员工 的 编码 出 错 了 ,造成 有 两 个 员工 的 编号 是 相同 的 。 但 是 当时 并 没有 发 
现 这 个 问题 。 在 许多 公司 的 数据 库 中 ,往往 有 很 多 表 , 每 一 个 表 中 都 保存 某 个 领域 的 数 
据 。 例 如 ,人 事 表 中 存储 了 员工 的 基本 信息 ,借款 表 中 记录 了 员工 的 借款 信息 。 但 是 后 来 
发 现 , 借 款 表 中 的 某 个 员工 不 是 本 公司 的 员工 ,因为 人 事 表 中 没有 该 员工 的 基本 信息 。 这 
种 问题 为 什么 会 发 生 呢 ? 诸如 此 类 的 问题 ,不 能 仅 依靠 数据 录入 人 员 和 操作 人 员 的 认真 
和 负责 ,而 是 应 该 有 一 套 保障 机 制 : 要 么 防止 这 些 问 题 发 生 , 要 么 发 生 这 些 问题 时 可 以 及 
时 地 发 现 。 数 据 完整 性 就 是 解决 这 些 问题 的 机 制 。 
数据 完整 性 就 是 指 存储 在 数据 库 中 的 数据 的 一 致 性 和 准确 性 ,防止 数据 库 中 存在 不 
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符合 语义 .不 正确 的 数据 。 为 维护 数据 库 的 完整 性 ,数据 库 管理 系统 提供 : 

(1) 完整 性 约束 条 件 定义 。 完 整 性 约束 条 件 也 称 为 完整 性 规则 ,是 数据 库 中 的 数据 
必须 满足 的 语义 约束 条 件 , 由 SQL 的 DDL 实现 ,作为 模式 的 一 部 分 存 和 数据库 中 。 

(2) 完整 性 检查 方法 。 检 查 数 据 是 否 满足 已 定义 的 完整 性 约束 条 件 称 为 完整 性 检 
查 , 一 般 在 insert、delete、update 执行 后 开始 检查 ,或 事务 提交 时 进行 检查 。 

(3) 违约 处 理 。 若 发 现 用 户 操作 违背 了 完整 性 约束 条 件 ,应 采取 一 定 的 措施 ,如 拒绝 
操作 等 。 

目前 商用 DBMS 都 支持 完整 性 控制 。 在 定义 数据 库 模 式 时 ,除了 非常 复杂 的 约束 
外 ,都 可 以 很 明确 地 对 完整 性 约束 加 以 说 明 。 


13.2.1 完整 性 约束 的 概念 和 类 型 


约束 是 通过 限制 列 中 数据 , 行 中 数据 和 表 之 间 数 据 来 保证 数据 完整 性 的 非常 有 效 的 
方法 。 约 束 可 以 确保 把 有 效 的 数据 输入 到 列 中 和 维护 表 与 表 之 间 的 特定 关系 。 每 一 种 数 
据 完 整 性 类 型 ,例如 实体 完整 性 ,参照 完整 性 和 用 户 自 定义 完整 性 ,都 由 不 同 的 约束 类 型 
来 保障 。 表 13. 1 描述 了 不 同类 型 的 约束 和 完整 性 之 间 的 关系 。 


表 13.1 约束 的 类 型 


完整 性 类 型 约束 类 型 描 述 

主键 每 一 行 的 唯一 标识 符 , 确 保 用 户 不 能 输入 元 余 值 和 确保 创建 索 
实体 完整 性 - 引 ,提高 性 能 ,不 允许 为 空 值 

UNIQUE 防止 出 现 元 余 值 ,并 且 确 保 创建 索引 ,提高 性 能 ,允许 为 空 值 
参照 完整 性 外 键 定义 一 列 或 者 几 列 ,其 值 与 本 表 或 者 另外 一 个 表 的 主键 值 匹配 

DEFAULT 在 使 用 INSERT 语句 插入 数据 时 ,如 果 某 个 列 的 值 没有 明确 提 
自 定义 完整 性 供 , 则 将 定义 的 默认 值 插入 到 该 列 中 

CHECK 指定 某 一 个 列 中 的 可 保存 值 的 范围 


定义 约束 表示 从 无 到 有 地 创建 约束 ,这 种 操作 可 以 使 用 CREATE TABLE 语句 或 
ALTER TABLE 语句 完成 。 使 用 CREATE TABLE 语句 表示 在 创建 表 的 时 候 定义 约 
东 , 使 用 ALTER TABLE 语句 表示 在 已 有 的 表 中 添加 约束 。 即 使 表 中 已 经 有 了 数据 ,也 
可 以 在 表 中 增加 约束 。 

定义 约束 时 , 既 可 以 把 约束 放 在 一 列 上 ,也 可 以 把 约束 放 在 多 列 上 。 如 果 把 约束 放 在 
一 列 上 ,该 约束 称 为 列 级 约束 ,因为 它 只 能 由 约束 所 在 的 列 参照 。 如 果 把 约束 放 在 多 列 
上 ,该 约束 称 为 表 级 约束 ,这 时 可 以 由 多 列 来 参照 该 约束 。 

当 定 义 约束 或 修改 约束 的 定义 时 ,应 该 考虑 下 列 因素 。 

(1) 不 必 删 除 表 , 就 可 以 直接 创建 ,修改 和 删除 约束 的 定义 。 

(2) 应 该 在 应 用 程序 中 增加 错误 检查 机 制 ,测试 数据 是 否 与 约束 相 冲 突 。 

(3) 当 在 表 上 增加 约束 时 ,将 检查 表 中 的 数据 是 否 与 约束 冲突 。 

当 创 建 约束 时 ,可 以 指定 约束 的 名 称 。 否 则 ,数据 库 管理 系统 将 提供 一 个 复杂 的 、 系 
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统 自动 生成 的 名 称 。 对 于 一 个 数据 库 来 说 ,约束 名 称 必须 是 唯一 的 。 
13.2.2 完整 性 约束 的 管理 


本 节 将 详细 介绍 主键 .UNIQUE, 外 键 .DEFAULT、CHECK 等 约束 的 特点 、 创 建 方 
法 ,修改 等 内 容 。 


1. 实体 完整 性 约束 


实体 完整 性 要 求 基本 表 的 主 码 值 唯一 且 不 允许 为 空 值 。 在 SQL 中 ,实体 完整 性 定义 
使 用 CREATE TABLE 语句 中 的 PRIMARY KEY 短语 实现 ,或 使 用 ALTER TABLE 
语句 中 的 ADD PRIMARY KEY 短语 实现 。 有 关 CREATE TABLE、ALTER TABLE 
语句 的 语法 详 见 第 11.2 节 。 

对 单 属性 构成 的 主键 可 定义 为 列 级 约束 ,也 可 定义 为 表 级 约束 ;对 多 个 属性 构成 的 主 
码 , 只 能 定义 为 表 级 约束 。 

【 例 13.10】 在 班级 表 Class 中 将 classNo 定义 为 主 码 。 


CREATE TABLE Class ( 


classNo char (6) NOT NULL, -- 班 级 号 
className varchar (30) unique NOT NULL, -=- 班 级 名 称 
institute varchar (30) NOT NULL, -- 所 属 学 院 
grade smallint default 0 NOT NULL, -- 年 级 
classNum tinyint NULL, -=- 班 级 人 数 


CONSTRAINT ClassPK PRIMARY KEY (classNo) 
) 


本 例 将 classNo 定义 为 主 码 , 使 用 CONSTRAINT 短语 为 该 约束 命名 为 ClassPK ,该 
主 码 定义 为 表 级 约束 。 该 例 还 可 按 下 面 的 方式 定义 。 


CREATE TABLE Class ( 
classNo char (6) NOT NULL PRIMARY KEY,， -班级 号 


) 


它 将 主 码 classNo 定义 为 列 级 约束 , 且 由 系统 取 约 束 名 称 。 也 可 为 约束 取 名 ,例如 : 


CREATE TABLE Class ( 
classNo char (6) NOT NULL -- 班 级 号 


CONSTRAINT ClassPK PRIMARY KEY, 


) 


它 也 是 将 主 码 classNo 定义 为 列 级 约束 , 且 约 东 取 名 为 ClassPK。 
【 例 13.11】 在 学 生成 绩 表 Score 中 将 sno .cno 定义 为 主 码 。 
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CREATE TABLE Score ( 


sno char (9) NOT NULL, -- 学 号 
cno char (3) NOT NULL, -课程 号 
score numeric(5, 1) default 0 NOT NULL, -成 绩 


/* 主 码 由 两 个 属性 构成 ,必须 作为 表 级 完整 性 进行 定义 * / 
CONSTRAINT ScorePK PRIMARY KEY (sno, cno) 
) 


也 可 以 写成 : 
CREATE TABLE Score ( 
sno char (9) NOT NULL, -- 学 号 
cno char (3) NOT NULL, -- 课 程 号 
score numeric(5, 1) default 0 NOT NULL, -成 绩 


/* 主 码 由 两 个 属性 构成 ,必须 作为 表 级 完整 性 进行 定义 * / 
PRIMARY KEY (sno, cno) 
) 


它 由 系统 自动 为 约束 取 名 。 

当 使 用 实体 完整 性 约束 时 ,应 该 考虑 下 列 因素 。 

(1) 每 一 个 表 最 多 只 能 定义 一 个 实体 完整 性 约束 。 

(2) 主键 列 所 输入 的 值 必须 是 唯一 的 。 如 果实 体 完整 性 约束 由 两 个 或 两 个 以 上 的 列 
组 成 ,那么 这 些 列 的 组 合 必 须 是 唯一 的 。 

(3) 主键 列 不 允许 空 值 。 

(4) 实体 完整 性 约束 在 指定 的 列 上 创建 了 一 个 唯一 性 索引 。 该 唯一 性 索引 既 可 以 是 
聚集 索引 ,也 可 以 是 非 聚集 索引 。 默 认 情 况 下 创建 的 是 聚集 索引 。 

(5) 可 以 在 定义 实体 完整 性 约束 时 添加 级 联 操作 选项 。 


2. 参照 完整 性 约束 


参照 完整 性 为 若干 参照 完整 性 约束 在 表 中 定义 外 键 值 , 一 个 表 中 的 FOREIGN KEY 
指向 另 一 个 表 中 的 PRIMARY KEY。 在 SQL 中 ,参照 完整 性 定义 使 用 CREATE 
TABLE 语句 中 的 FOREIGN KEY 和 REFERENCES 短语 来 实现 ,或 通过 使 用 ALTER 
TABLE 语句 中 的 ADD FOREIGN KEY 短语 来 实现 。 其 中 ,FOREIGN KEY 指出 定义 
哪些 列 为 外 码 ,REFERENCES 短语 指明 这 些 外 码 参照 哪些 关系 。 给 出 FOREIGN KEY 
定义 的 关系 称 为 参照 关系 ,由 REFERENCES 指明 的 表 称 为 被 参照 关系 。 

【 例 13. 12】〗】 在 学 生成 绩 表 Score 中 将 sno .cno 定义 为 外 码 。 


CREATE TABLE Score ( 


sno char (9) NOT NULL, -学 号 
cno char (3) NOT NULL, -课程 号 
score numeric(5, 1) default 0 NOT NULL 一 -成 绩 


CHECK ( score BETWEEN 0.0 RND 100.0), 
/* 主 码 由 两 个 属性 构成 ,必须 作为 表 级 完整 性 进行 定义 * / 
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CONSTRAINT ScorePK PRIMARY KEY (sno, cno), 
/* 表 级 完整 性 约束 条 件 , sno 是 外 码 ,被 参照 表 是 student * / 
CONSTRAINT ScoreFK1 FOREIGN KEY (sno) 
REFERENCES Student (sno), 
/* 表 级 完整 性 约束 条 件 , cno 是 外 码 ,被 参照 表 是 course */ 
CONSTRAINT ScoreFK2 FOREIGN KEY (cno) REFERENCES Course (cno) 
) 


本 例 中 ,Score 为 参照 表 ,Student 和 Course 为 被 参照 表 。Score 表 中 sno 属性 列 参 
照 Student 的 sno 列 ,其 含义 为 : Score 表 中 sno 列 的 取 值 必须 是 Student 表 中 sno 列 的 
某 个 属性 值 , 即 不 存在 一 个 未 注册 的 学 生 选 修了 课程 。Score 表 中 cno 属性 列 参照 
Course 表 的 cno 列 , 其 售 义 为 : Score 中 cno 列 的 取 值 必须 是 Course 中 cno 列 的 某 个 属 
性 值 , 即 不 存在 学 生 选 修了 一 门 不 存在 的 课程 。 

本 例 也 可 改写 为 ， 


CREATE TABLE Score ( 


/* 表 级 完整 性 约束 条 件 , sno 是 外 码 ,被 参照 表 是 student * / 
FOREIGN KEY (sno) REFERENCES Student (sno), 
/* 表 级 完整 性 约束 条 件 ,cno 是 外 码 ,被 参照 表 是 course * / 
FOREIGN KEY (cno) REFERENCES Course (cno) 

) 


这 里 的 外 码 约 束 由 系统 自动 命名 。 

在 实现 参照 完整 性 时 ,提供 定义 外 码 列 是 否 允 许 空 值 的 机 制 。 如 果 外 码 是 主 码 的 一 
部 分 , 则 外 码 不 允许 为 空 值 ,本 例 的 两 个 外 码 皆 不 允许 为 空 值 。 

如 果 定义 了 参照 完整 性 ,在 对 参照 表 和 被 参照 表 进 行 修改 操作 时 有 可 能 会 破坏 参照 
完整 性 ,系统 首先 会 检查 是 否 违 反 了 参照 完整 性 ,如 果 违 反 了 , 则 进行 违约 处 理 。 违 约 处 
理 的 策略 如 下 。 

(1) 拒绝 (NO ACTION) 执 行 ,这 是 系统 的 默认 策略 ,如 果 发 生 了 违约 , 则 阻止 该 操 
作 。 当 在 被 参照 关系 中 删除 元 组 时 , 仅 当 参照 关系 中 没有 任何 元 组 的 外 码 值 与 被 参照 关 
系 中 要 删除 元 组 的 主 码 值 相同 时 ,系统 才 执行 删除 操作 ,否则 拒绝 此 操作 。 如 要 删除 学 生 
表 Student 中 学 号 为 “201823001” 的 记录 ,系统 将 不 允许 ,因为 学 号 为 *201823001” 的 学 生 
在 成 绩 表 Score 中 选修 了 课程 。 

当 在 参照 关系 中 修改 元 组 时 , 仅 当 参 照 关 系 中 修改 后 的 元 组 的 外 码 值 依然 在 被 参照 
关系 中 时 ,系统 才 执 行 修改 操作 ,否则 将 拒绝 。 如 在 成 绩 表 Score 中 修改 “201823001” 学 
生 的 学 号 为 “201823006”, 系统 将 不 允许 ,因为 学 号 为 “201823006” 的 学 生 在 学 生 表 
Student 中 不 存在 。 

在 被 参照 关系 中 修改 元 组 时 , 仅 当 被 参照 关系 中 修改 前 的 元 组 的 主 码 值 没有 出 现在 
参照 关系 的 外 码 中 ,系统 才 执行 修改 操作 ,否则 拒绝 该 操作 。 如 在 学 生 表 Student 中 修改 
“201823001? 学 生 的 学 号 为 "201823006”, 系 统 将 不 允许 ,因为 学 号 为 “201823001? 的 学 生 
在 成 绩 Score 中 已 经 选修 了 课程 。 
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在 参照 关系 中 插入 元 组 : 仅 当 参照 关系 中 插入 的 元 组 的 外 码 值 等 于 被 参照 关系 中 革 
个 元 组 的 主 码 值 时 ,系统 才 执行 插入 操作 ,否则 拒绝 该 操作 。 如 在 成 绩 表 Score 中 插入 一 
条 记录 “201823006,001, 78”, 系 统 将 不 允许 ,因为 学 号 “201823006” 在 学 生 表 Student 中 
不 存在 。 

(2) 级 联 (CASCADE) 操 作 。 当 删除 或 修改 被 参照 关系 的 某 些 元 组 造成 了 与 参照 关 
系 的 不 一 致 时 , 则 删除 或 修改 参照 表 中 所 有 不 一 致 的 元 组 。 

例如 ,删除 学 生 表 Student 中 学 号 为 *201823001” 的 记录 , 则 自动 删除 被 参照 关系 成 
绩 表 Score 中 学 号 为 *201823001” 的 所 有 选课 记录 。 修 改 学 生 表 Student 中 的 学 号 ,由 
“201823001” 改 为 “201823006”, 则 自动 修改 被 参照 关系 成 绩 表 Score 中 学 号 为 
“201823001” 的 所 有 选课 记录 ,将 “201823001” 全 部 改 为 “201823006”。 

(3) 设置 为 空 值 (SET NULL)。 对 于 参照 完整 性 ,除了 定义 外 码 , 还 应 定义 外 码 列 是 
否 允 许 空 值 。 如 果 外 码 是 主 码 的 一 部 分 , 则 外 码 不 允许 为 空 值 。 

(4) 置 空 值 删除 (NULLIFIES) 。 删 除 被 参照 关系 的 元 组 ,并 将 参照 关系 中 相应 元 组 
的 外 码 值 置 空 值 。 

【 例 13.13】 在 学 生成 绩 表 Score 中 将 sno、cno 定义 为 外 码 , 且 sno 外 码 定义 为 级 联 
删除 和 修改 操作 ,cno 外 码 定 义 为 级 联 修 改 操作 。 


CREATE TABLE Score ( 


号 


sno char (9) NOT NULL, -学 守 
cno char (3) NOT NULL, -课程 号 
score numeric(5, 1) default 0 NOT NULL, -- 成 绩 


/* 主 码 由 两 个 属性 构成 ,必须 作为 表 级 完整 性 进行 定义 * / 

CONSTRAINT ScorePK PRIMARY KEY (sno, cno), 

/* 表 级 完整 性 约束 条 件 , sno 是 外 码 , 被 参照 表 是 student * / 

CONSTRAINT ScoreFK1 FOREIGN KEY (sno) REFERENCES Student (sno) 
ON DELETE CASCADE /x 级 联 删 除 Score 表 中 相应 的 元 组 * / 
ON UPDATE CASCADE, /x* 级 联 更 新 Score 表 中 相应 的 元 组 * / 

/* 表 级 完整 性 约束 条 件 , cno 是 外 码 , 被 参照 表 是 course * / 

CONSTRAINT ScoreFK2 FOREIGN KEY (cno) REFERENCES Course (cno) 
ON DELETE NO ACTION /* 该 定义 为 默认 值 ,可 以 不 定义 * / 
/* 当 更 新 course 表 中 的 cno 时 ,级 联 更 新 Score 表 中 相应 的 元 组 * / 
ON UPDATE CASCADE 

) 


当 使 用 参照 完整 性 约束 时 ,需要 考虑 下 列 因素 。 

(1) 参照 完整 性 约束 提供 了 单列 参照 完整 性 和 多 列 参 照 完整 性 。 在 FOREIGN KEY 
子 句 中 列 的 数量 和 数据 类 型 必须 和 REFERENCES 子 句 中 列 的 数量 和 数据 类 型 匹配 。 

(2) 不 像 实体 完整 性 约束 或 唯一 性 约束 ,参照 完整 性 约束 不 能 自动 创建 索引 。 然 而 ， 
如 果 在 数据 库 中 经 常 使 用 连接 查询 ,那么 ,为 了 加 快 连接 查询 的 速度 ,提高 连接 查询 的 性 
能 ,用 户 应 该 在 参照 完整 性 约束 列 上 手工 创建 索引 。 

(3) 当 用 户 修改 参照 完整 性 约束 所 在 表 中 的 数据 时 ,该 用 户 必须 拥有 参照 完整 性 约 
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东 所 参考 表 的 SELECT 权限 或 REFERENCES 权限 。 
(4) 在 定义 参照 完整 性 约束 时 ,如 果 参 照 同一 个 表 中 的 列 时 ,只 能 使 用 REFERENCES 
子 句 ,不 能 使 用 FOREIGN KEY 子 句 。 


3. 用 户 自 定义 完整 性 


实体 完整 性 和 参照 完整 性 都 是 由 系统 规定 的 ,而 用 户 定义 的 完整 性 则 是 由 用 户 根 据 
具体 的 应 用 环境 自己 规定 的 一 些 特殊 的 约束 条 件 。 利 用 UNIQUE 约束 .CHECK 约束 和 
NOT NULL/NULL 约束 等 可 以 定义 用 户 定义 的 完整 性 。 

【 例 13.14】 在 学 生 表 Student 中 定义 属性 sno 取 值 必须 为 数字 ,性 别 只 能 取 “ 男 ”或 
“ 女 ”, 民 族 默认 值 为 “汉族 ”。 


CREATE TABLE Student ( 
sno char (9) NOT NULL 
CHECK ( sno LIKE ' [0-9] [0-9] [0-9] [0-9] [0- 9] [0-9] [0-9]" )， 
-- 学 号 ,由 7 位 数字 组 成 


sname varchar (20) NOT NULL, -- 姓 名 ,不 允许 为 空 值 
/* 性 别 ,允许 为 空 值 , 仅 取 男 或 女 两 个 值 * / 
sex char (2) NULL CHECK ( sex IN ( ' 男 ',' 女 ') )， 
birthday datetime NULL, -- 出 生日 期 ,允许 为 空 值 
native varchar (20) NULL, -籍贯 ,允许 为 空 值 
nation varchar (30) ” default ' 汉 族 ' NULL, 
-- 民 族 ,允许 为 空 值 ,默认 为 “汉族 ” 
classNo char (6) NULL, -- 所 属 班级 ,允许 为 空 值 


CONSTRAINT StudentPK PRIMARY KEY (sno), 
CONSTRAINT StudentFK FOREIGN KEY (classNo) 
REFERENCES Class (classNo) 
) 


【 例 13.15】 在 班级 表 中 定义 班级 名 称 唯一 。 


CREATE TABLE Class ( 


classNo char (6) NOT NULL, 

-- 班 级 号 ,不 允许 为 空 值 
className varchar (30) UNIQUE NOT NULL, 

-班级 名 称 ,必须 唯一 ,不 允许 为 空 值 
institute varchar (30) NOT NULL, 

-- 所 属 学 院 , 不 允许 为 空 值 
grade smallint default 0 NOT NULL, 

-- 年 级 ,默认 值 为 0, 不 允许 为 空 值 
classNum tinyint NULL，- -班级 人 数 ,人 允许 为 空 值 


CONSTRAINT ClassPK PRIMARY KEY (classNo) 
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13.3 ”Transact-SQL 基础 


SQL 结构 简洁 ,功能 强大 ,简单 易学 ,所 以 自从 IBM 公司 1981 年 推出 以 来 ,就 得 到 
了 广泛 的 应 用 。Transact-SQL( 又 称 T-SQL) 是 Microsoft SQL Server 提供 的 查询 语言 ， 
是 微软 公司 对 SQL 的 扩展 ,具有 SQL 的 主要 特点 ,同时 增加 了 变量 .运算 符 、 函 数 ` 流 程 
控制 和 注释 等 语言 元 素 , 使 得 其 功能 更 加 强大 。 使 用 Transact-SQL 编写 应 用 程序 可 以 
完成 所 有 的 数据 库 管理 工作 。 应 用 程序 必须 依靠 用 Transact-SQL 语句 编写 的 指令 与 数 
据 库 管理 系统 进行 交互 。 本 节 就 这 些 附 加 的 语言 元 素 做 一 个 详细 的 介绍 。 


13.3.1 SQL 对 象 的 命名 规则 和 注释 


1. SQL 对 象 的 命名 规则 


SQL 常规 对 象 的 标识 符 规则 如 下 。 

(1) 第 一 个 字符 必须 是 下 列 字符 之 一 : 字母 a~z 和 A~Z, 来 自 其 他 语言 的 字母 字 
符 ,下面 线 _、@ 或 者 数字 符号 # 。 

(2) 后 续 字 符 可 以 是 所 有 的 字母 .十进制 数字 、@ 符 号 ,美元 符号 ($ ) ,数字 符号 或 下 
画 线 。 


2. 注释 


所 有 的 程序 设计 语言 都 有 注释 。 注 释 是 程序 代码 中 不 被 执行 的 文本 字符 串 ,用 于 对 
代码 进行 说 明 或 暂时 仅 用 于 正在 进行 诊断 的 部 分 语句 。 一 般 地 ,注释 主要 描述 程序 名 称 、 
作者 名 称 、 变 量 说 明代 码 更 改 日 期 \ 算 法 描述 等 。 在 Microsoft SQL Server 系统 中 支持 
两 种 注释 方式 , 即 双 连 字符 (一 ) 注 释 方 式 和 正 斜 杠 星 号 字符 对 (/ x … x /) 注 释 方式 。 

在 双 连 字符 (一 ) 注 释 方式 中 ,从 双 连 字符 开始 到 行 尾 的 内 容 都 是 注释 内 容 。 这 些 注 
释 内 容 既 可 以 与 要 执行 的 代码 处 于 同一 行 ,也 可 以 另 起 一 行 。 双 连 字符 (一 ) 注 释 方式 主 
要 用 于 在 一 行 中 对 代码 进行 解释 和 描述 。 当 然 , 双 连 字 符 (--) 注 释 方 式 也 可 以 进行 多 行 
注释 ,每 一 行 都 须 以 双 连 字符 开始 。 

在 正 斜 杠 星 号 字符 对 (/* … x /) 注 释 方式 中 ,开始 注释 对 (/* ) 和 结束 注释 对 (* /) 
之 间 的 所 有 内 容 均 视 为 注释 。 这 些 注释 字符 既 可 以 用 于 多 行 注释 ,也 可 以 与 执行 的 代码 
处 在 同一 行 ,甚至 还 可 以 在 可 执行 代码 的 内 部 。 

双 连 字符 (一 ) 注 释 和 正 斜 杠 星 号 字符 对 (/ * … * /) 注 释 都 没有 注释 长 度 的 限制 。 一 
般 地 ,行内 注释 采用 双 连 字符 (一 ) ,多 行 注释 采用 正 斜 杠 星 号 字符 对 。 


13.3.2 数据 类 型 


在 建立 SQL Server 表格 时 ,要 求 用 户 先 对 数据 列 进行 数据 类 型 的 确定 。 定 义 表 列 的 
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数据 类 型 后 ,数据 列 的 数据 类 型 将 作为 表 的 永久 属性 加 以 保存 ,普通 用 户 是 无 法 对 其 进行 
更 改 的 。 因 此 在 建立 自己 的 表格 前 , 先 全 面 地 了 解 SQL Server 数据 类 型 并 精心 选择 表格 
列 的 数据 类 型 ,是 创建 的 数据 表格 能 够 满足 设计 需求 和 表格 性 能 良好 的 前 提 。SQL 
Server 提供 了 许多 数据 类 型 ,总 体 来 讲 包 括 系统 数据 类 型 和 用 户 自 定义 数据 类 型 两 大 类 。 
系统 数据 类 型 可 以 分 为 数字 数据 类 型 .字符 数据 类 型 .日 期 和 时 间 数 据 类 型 .二 进 制 数据 
类 型 以 及 其 他 数据 类 型 等 。 而 用 户 自 定义 数据 类 型 则 是 用 户 在 系统 数据 类 型 的 基础 上 自 
己 建立 的 数据 类 型 。SQL Server 的 数据 类 型 如 表 13. 2 所 示 。 


表 13.2 ”SQL Server 的 数据 类 型 


数据 类 型 名 称 主要 类 型 
整 型 数据 类 型 INT.SMALLINT TINYINT 
浮 点 数据 类 型 REAL.FLOAT .DECIMAL NUMERIC 
字符 数据 类 型 CHAR.VARCHAR.TEXT.NVARCHAR.NTEXT 
日 期 和 时 间 数 据 类 型 DATETIME.SMALLDATETIME 
货币 数据 类 型 MONEY .SMALLMONEY 
位 数据 类 型 BIT 
二 进 制 数据 类 型 BINARY .BARBINARY 
特殊 数据 类 型 TIMESTAMP.UNIQUEIDENTIFIER 
用 户 自 定义 数据 类 型 


下 面 分 别 介绍 SQL Server 的 系统 数据 类 型 和 用 户 自 定义 数据 类 型 。 
1. 系统 数据 类 型 


1) 整 型 数据 类 型 

整 型 数据 类 型 表示 可 以 存储 整数 精确 数据 。 整 型 数据 类 型 可 以 分 为 4 种 , 即 
BIGINT、INT、SMALLINT、TINYINT。 可 以 从 取 值 范围 和 长 度 两 个 方面 理解 这 些 整 型 
数据 类 型 。 

(1) BIGINT: 长 整数 型 ,长 度 是 8B。 由 于 每 个 字 节 的 长 度 是 8 位 且 可 以 存储 正 负数 
字 , 因 此 BIGINT 数据 类 型 的 取 值 范围 是 一 9 223 372 036 854 775 808 一 
9 223 372 036 854 775 807。 

(2) INT: 整数 型 ,长 度 为 4B, 存 储 范围 可 以 是 一 2 147 483 648 一 2 147 483 647。 实 
际 上 ,INT 数据 类 型 是 最 常 使 用 的 数据 类 型 。 当 INT 数据 类 型 表示 的 数据 长 度 不 足 时 ， 
才 应 该 考虑 使 用 BIGINT 数据 类 型 。 

(3) SMALLINT: 短 整数 型 ,长度 为 2B, 存 储 范围 较 INT 小 ,可 以 存储 一 32 768 一 
32 767 的 所 有 正 负数 。 

(4) TINYINT: 微 整数 型 ,长度 为 1B, 存 储 范 围 较 BINGINT INT 和 SMALLINT 
小 ,可 以 存储 0 一 255 的 所 有 正 整数 。 
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2) 浮 点 数据 类 型 

浮 点 数据 类 型 可 以 用 来 存储 含 小 数 的 十 进 制 数 。 浮 点 数值 的 数据 在 SQL Server 中 
采用 只 和 人 不 舍 的 方式 进行 存储 。 

(1) REAL: 长 度 为 4B。 可 以 存储 一 3. 40E 十 38 一 3. 40E 十 38 的 十 进 制 数值 ,最 大 可 
以 有 7 位 精确 数位 。 

(2) FLOAT: 可 以 精确 到 第 15 位 小 数 , 其 范围 为 一 1.79E-308 一 1.79E 十 308。 

(3) DECIMAL 和 NUMERIC: 这 两 种 数据 类 型 的 功能 是 等 价 的 ,只 是 名 称 不 同 而 
已 。 它 们 可 以 提供 小 数 需 要 的 实际 存储 空间 ,但 也 有 一 定 的 限制 ,可 以 用 2 一 17B 来 存 
储 一 108 十 1 一 108 一 1 的 数值 。 以 DECIMAL 数据 类 型 为 例 ,在 声明 数据 类 型 时 ,可 以 
使 用 DECIMAL (p，s) 定 义 数据 的 精度 和 小 数位 数 。 其 中 ,p 表示 数字 的 精度 ,s 表示 
数字 的 小 数位 数 。 精 度 p 的 取 值 范围 是 1 一 38 ,默认 值 是 18。 小 数位 数 s 的 取 值 范围 
必须 是 0 一 p 的 数值 (包括 0 和 p)。 从 这 些 约定 可 知 ,DECIMAL 数据 类 型 的 取 值 范围 
是 一 108 十 1 一 1038 一 1。 

3) 字符 数据 类 型 

字符 数据 类 型 可 以 用 来 存储 各 种 含 字母 .数字 和 符号 组 成 的 字符 串 。 在 SQL 中 输入 
字符 数据 时 ,必须 将 数据 引 在 单 引号 中 ,和 否则 SQL 不 能 接受 该 字符 数据 。 字 符 数据 类 型 
包括 CHAR、VARCHAR TEXT 、NVARCHAR 和 NTEXT 等 数据 类 型 ,其 中 前 两 种 比 
较 常 用 。 

(1) CHAR: 其 定义 形式 为 CHAR(n) ,每 个 字符 和 符号 占用 一 个 字 节 的 存储 空间 。 
其 中 ,n 表示 该 字符 数据 的 字 节 长 度 , 取 值 范围 是 1~8000 的 整数 。 如 果 长 度 超过 规定 范 
围 , 则 系统 只 取 规 定 范围 内 的 字符 串 ;长 度 不 足 规定 范围 时 , 则 字符 串 后 面 的 位 置 将 被 空 
格 填充 。 

(2) VARCHAR: 其 定义 形式 为 VARCHAR(n)。 用 VARCHAR 数据 类 型 可 以 存 
储 长 达 8000 个 字符 的 可 变 长 度 字符 串 。 它 的 存储 空间 随 输 入 数据 的 实际 长 度 而 变化 ,但 
最 大 长 度 不 得 超过 n 指定 的 值 。 若 存储 数据 没有 超过 最 大 长 度 n, 则 字符 串 后 面 的 位 置 
并 不 会 填充 空格 ,其 他 使 用 方式 与 CHAR 数据 类 型 类 似 。 

(3) TEXT: 文本 数据 类 型 用 来 存储 可 变 长 度 的 文本 数据 。TEXT 存储 大 量 文本 
数据 时 ,其 容量 理论 上 为 22 一 1(2 147 483 647)B。 在 实际 应 用 时 需要 视 硬 盘 的 存储 
空间 而 定 。 

(4) NVARCHAR: 其 定义 形式 为 NVARCHAR(n) ,用 于 支持 存储 可 变 长 度 的 国际 
上 的 非 英语 语种 字符 串 。 

(5) NTEXT: 与 TEXT 数据 类 型 类 似 ,存储 在 其 中 的 数据 通常 是 直接 能 输出 到 显示 
设备 上 的 字符 ,显示 设备 可 以 是 显示 器 、 窗 口 或 者 打印 机 。 

4) 日 期 和 时 间 数 据 类 型 

日 期 和 时 间 数 据 类 型 用 于 存储 日 期 和 时 间 数 据 。 它 具有 下 面 两 种 形式 ,区 别 在 于 存 
储 长 度 所 代表 的 时 间 范 围 和 存储 精确 度 的 不 同 。 

(1) DATETIME: 用 于 存储 日 期 和 时 间 的 结合 体 。 它 可 以 表示 的 范围 是 1753 年 1 
月 1 日 ~9999 年 12 月 31 日 的 所 有 日 期 和 时 间 。 时 间 精 确 度 是 3. 33ms。 
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(2) SMALLDATETIME: 与 DATETIME 数据 类 型 类 似 , 但 其 日 期 时 间 范 围 较 小 ， 
表示 的 范围 是 1900 年 1 月 1 日 ~2079 年 12 月 31 日 ,时 间 精 确 度 是 Imin 。 

5) 货币 数据 类 型 

货币 数据 类 型 用 于 存储 货币 或 现金 值 , 包 括 MONEY 型 和 SMALLMONEY 型 。 在 
使 用 货币 数据 类 型 时 ,应 在 数据 前 加 上 货币 符号 ,以 便 系统 辨识 其 为 哪 国 的 货币 ,如 果 不 
加 货币 符号 , 则 系统 默认 为 “ 半 ?”。 

(1) MONEY: 用 于 存储 货币 值 , 存 储 在 MONEY 数据 类 型 中 的 数值 以 一 个 正 数 部 分 和 
一 个 小 数 部 分 存储 在 两 个 4B 的 整 型 值 中 ,其 取 值 为 一 28 (一 9 223 372 036 854 775 808) 一 
28 一 1( 十 9 223 372 036 854 775 807) ,精确 到 货币 单位 的 千 分 之 十 。 

(2) SMALLMONEY: 与 MONEY 数据 类 型 类 似 , 但 其 存储 的 货币 值 范 围 比 
MONEY 数据 类 型 小 ,SMALLMONEY 数据 类 型 只 需要 4 个 存储 字 节 , 取 值 范围 为 
一 214 748. 364 8~214 748. 364 7。 

可 以 说 ,MONEY 和 SMALLMONEY 数据 类 型 是 一 种 确定 性 数值 数据 类 型 ,因为 它们 
的 精度 和 小 数位 数 都 是 确定 的 。 但 是 ,MONEY 和 SMALLMONEY 数据 类 型 也 有 一 些 与 其 
他 数字 数据 类 型 不 同 的 地 方 。 第 一 ,它们 表示 了 货币 数值 ,因此 可 以 在 数字 前 面 加 上 $ 或 其 
他 货币 单位 的 记号 作为 货币 符号 。 第 二 ,它们 的 小 数位 数 最 多 是 4 位 ,也 就 是 说 可 以 表示 出 
当前 货币 单位 的 万 分 之 一 。 第 三 , 当 小 数位 数 超过 4 位 时 ,自动 按照 四 舍 五 人 进行 处 理 。 

6) 位 数据 类 型 

BIT 是 可 以 存储 1.0 或 NULL 数据 的 数据 类 型 。 这 些 数据 主要 是 用 于 一 些 条 件 逮 
辑 判断 。 也 可 以 把 TRUE 和 FALSE 数据 存储 到 BIT 数据 类 型 中 ,这 时 需要 按照 字符 格 
式 存储 TRUE 和 FALSE 数据 。 

7) 二 进 制 数据 类 型 

(1) BINARY: 其 定义 形式 为 BINARY(Cn) ,数据 的 存储 长 度 是 固定 的 , 即 (n 十 4)B。 

(2) 当 输 入 的 二 进 制 数 据 长 度 小 于 n 时 ,余下 部 分 填充 0。 

(3) VARBINARY: 其 定义 形式 为 VARBINARY(n) ,数据 的 存储 长 度 是 变化 的 , 它 
为 实际 所 输入 的 长 度 加 上 4B, 其 他 含义 与 BINARY 相似 。 

除了 前 面 介绍 的 数据 类 型 之 外 ,SQL Server 系统 还 提供 了 CURSOR、TIMESTAMP、 
UNIQUEIDENTIFIER 及 XML 等 数据 类 型 。 使 用 这 些 数据 类 型 可 以 完成 特殊 数据 对 象 的 
定义 .存储 和 使 用 。 

(1) CURSOR : 是 变量 或 存储 过 程 的 输出 参数 使 用 的 一 种 数据 类 型 ,有 时 也 把 这 种 
数据 类 型 称 为 游标 。 

(2) TIMESTAMP: 是 一 个 特殊 的 用 于 表示 先后 顺序 的 时 间 戳 数据 类 型 。 该 数据 类 
型 可 以 为 表 中 数据 行 加 上 一 个 版 本 惟 。 

(3) UNIQUEIDENTIFIER: 是 一 个 具有 16B 的 全 局 唯一 性 标志 符 , 用 来 确保 对 象 
的 唯一 性 。 可 以 在 定义 列 或 变量 时 使 用 该 数据 类 型 ,这些 定义 的 主要 目的 是 在 合并 复制 
和 事务 复制 中 确保 表 中 数据 行 的 唯一 性 。 

(4) XML: 用 于 存储 XML 数据 。 可 以 像 使 用 INT 数据 类 型 一 样 使 用 XML 数据 类 
型 。 需 要 注意 的 是 ,存储 在 XML 数据 类 型 中 的 数据 实例 的 最 大 值 是 2GB。 
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2. 自 定义 数据 类 型 


SQL Server 还 允许 用 户 在 系统 数据 类 型 的 基础 上 建立 自己 的 数据 类 型 。 但 需要 注 
意 的 是 ,SQL Server 的 用 户 自 定义 数据 类 型 并 非 是 除了 前 面 所 述 的 基本 类 型 以 外 的 其 他 
新 的 数据 类 型 ,而 是 在 SQL Server 的 基本 数据 类 型 的 基础 上 ,将 某 个 数据 类 型 加 上 用 户 
自 定义 的 一 些 实际 限制 ,成 为 用 户 在 实际 工作 中 根据 自己 的 实际 需要 使 用 的 特殊 的 、 专 门 
的 一 种 数据 类 型 。 通 过 使 用 用 户 自 定义 数据 类 型 的 方式 可 以 使 数据 库 表格 的 结果 更 加 容 
易 阅 读 ,方便 用 户 自己 的 理解 ,并 且 保 证 了 数据 库 内 部 数据 类 型 的 统一 性 。 


13.3.3 变量 


变量 在 编程 中 占有 重要 地 位 。 利 用 变量 可 以 存储 临时 性 数据 。SQL Server 提供 两 
种 变量 : 系统 提供 的 全 局 变量 和 用 户 自 定义 的 局 部 变量 。 


1. 全 局 变量 


全 局 变量 是 由 系统 定义 和 维护 的 变量 ,是 用 于 记录 服务 器 活动 状态 的 一 组 数据 。 全 
局 变量 名 由 @@ 符 号 开始 。 用 户 不 能 建立 全 局 变量 ,也 不 可 能 使 用 SET 语句 去 修改 全 局 
变量 的 值 。SQL Server 提供 了 三 十 多 个 全 局 变量 ,下 面 简单 介绍 一 下 它们 的 功能 。 

@@SERVERNAME: 返回 运行 SQL Server 的 本 地 服务 器 的 名 称 。 

@@VERSION: 返回 当前 的 SQL Server 安装 的 版 本 、 处 理 器 体系 结构 、 生 成 日 期 和 

@@CPU_BUSY; 返回 SQL Server 自 上 次 启动 后 的 工作 时 间 , 以 ms 为 单位 。 

@@IO_BUSY: 返回 SQL Server 最 近 一 次 启动 以 来 ,执行 输入 和 输出 操作 的 时 间 。 

@@IDLE: 返回 SQL Server 自 上 次 启动 后 的 空闲 时 间 。 

@@CONNECTIONS: 无 论 连接 是 成 功 还 是 失败 ,都 会 返回 SQL Server 自 上 次 启 
动 以 来 尝试 的 连接 数 。 

@@MAX_CONNECTIONS: 返回 SQL Server 实例 允许 同时 进行 的 最 大 用 户 连 
接 数 。 

@@PACK_RECEIVED: 返回 SQL Server 自 上 次 启动 后 从 网 络 读 取 的 输入 数据 
包 数 。 

@@PACK_SENT: 返回 SQL Server 自 上 次 启动 后 写 入 网络 的 输出 数据 包 数 。 

@@PACKET_ERRORS: 返回 自 上 次 启动 SQL Server 后 ,在 读 写 过 程 中 发 生 的 网 
络 数据 包 错误 数 。 

@@TOTAL_ERRORS: 返回 自 上 次 启动 SQL Server 之 后 所 遇 到 的 磁盘 写 人 错 
误 数 。 

@@TOTAL READ: 返回 SQL Server 自 上 次 启动 之 后 读 取 磁 盘 的 数目 。 

@@TOTAL_WRITE: 返回 自 上 次 启动 SQL Server 以 来 所 执行 的 磁盘 写 入 数 。 

@@ERROR: 返回 执行 的 上 一 个 Transact-SQL 语句 的 错误 号 。 
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@@LANGUAGE: 返回 当前 SQL Server 所 用 的 语言 名 称 。 

@@LANGID: 返回 SQL Server 当前 使 用 的 语言 的 逻辑 标识 号 。 

@@TRANCOUNT: 返回 当前 连接 的 活动 事务 数 。 

@@NESTLEVEL: 返回 对 本 地 服务 器 上 执行 的 当前 存储 过 程 的 嵌 套 级 别 , 取 值 为 
0 一 16。 

@@SPID: 返回 当前 用 户 进程 的 标识 号 。 

@@PROCID: 返回 Transact-SQL 当前 模块 的 对 象 标识 号 。Transact-SQL 模块 可 
以 是 存储 过 程 、 用 户 定义 函数 或 触发 器 。 

@@MAX_PRECISION: 按照 服务 器 中 的 当前 设置 ,返回 decimal 和 numeric 数据 
类 型 所 用 的 精度 级 别 ,默认 最 大 精度 返回 38。 

@@TEXTSIZE: 返回 SET 语句 的 textsize 选项 的 当前 值 , 它 指定 select 语句 返回 
的 text 或 image 数据 类 型 的 最 大 长 度 ,单位 为 B。 

@@DBTS: 返回 当前 数据 库 的 当前 timestamp 数据 类 型 的 值 。 

@@FETCH_STATUS: 返回 针对 连接 当前 打开 的 任何 游标 ,发 出 的 上 一 条 游标 
FETCH 语句 的 状态 。 

@@ROWCOUNT: 返回 上 一 次 语句 影响 的 行 数 。 

@@CURSOR_ROWS: 返回 连接 上 打开 的 上 一 个 游标 中 的 当前 设 定 行 的 数目 。 可 以 
调用 @@CURSOR_ROWS 来 确定 当 此 全 局 变量 被 调用 时 检索 了 游标 符合 条 件 的 行 数 。 

@@DATEFIRST: 返回 一 个 星期 中 的 第 一 天 ,如 星期 天 、 星 期 一 等 。 

@@IDENTITY: 返回 插入 到 表 的 IDENTITY 列 的 最 后 一 个 值 。 

@@LOCK_TIMEOUT: 返回 当前 会 话 的 当前 锁定 超时 时 限 ,其 单位 为 ms。 

@@OPTIONS: 返回 有 关 当 前 SET 选项 的 信息 。 

@@REMSERVER: 返回 远程 SQL Server 数据 库 服 务 器 在 登录 记录 中 显示 的 名 称 。 

@@SERVICENAME: 返回 SQL Server 正在 其 下 运行 的 注册 表 项 名 称 。 

@@TIMETICKS: 返回 每 个 时 钟 周期 的 微 秒 数 。 

2. 局 部 变量 

用 户 自 定义 的 变量 称 为 局 部 变量 。 局 部 变量 是 用 于 保存 特定 类 型 的 单个 数据 值 的 变 
量 。 在 Transact-SQL 中 ,局 部 变量 必须 先 定义 ,然后 再 使 用 。 

1) 局 部 变量 的 定义 

在 Transact-SQL 中 ,可 以 使 用 DECLARE 语句 声明 变量 。 在 声明 变量 时 需要 注意 : 
第 一 ,为 变量 指定 名 称 , 且 名 称 的 第 一 个 字符 必须 是 @ ;第 二 ,指定 该 变量 的 数据 类 型 和 长 
度 ; 第 三 ,默认 情况 下 将 该 变量 值 设置 为 NULL。 局 部 变量 的 声明 格式 为 : 


DECLARE @ 局 部 变量 名 ”数据 类 型 


@ 局 部 变量 名 数据 类 型 
可 以 在 一 个 DECLARE 语句 中 声明 多 个 变量 ,多 个 变量 之 间 使 用 逗号 分 隔 开 。 变 量 
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的 作用 域 是 可 以 引用 该 变量 的 Transact-SQL 语句 的 范围 。 变 量 的 作用 域 从 声明 变量 的 
地 方 开始 到 声明 变量 的 批 处 理 的 结尾 。 
2) 局 部 变量 的 赋值 
有 两 种 为 变量 赋值 的 方式 ,即使 用 SET 语句 为 变量 赋值 和 使 用 SELECT 语句 选择 
列表 中 当前 所 引用 值 来 为 变量 赋值 。 
采用 SET 语句 赋值 的 语法 格式 为 : 
SET @ 局 部 变量 名 = 表达 式 
采用 SELECT 语句 赋值 的 语法 格式 为 : 
SELECT @ 局 部 变量 名 = 表达 式 


SELECT @ 局 部 变量 名 = 表达 式 , 8 局 部 变量 名 = 表达 式 ，… 


FROM 表 名 


WHERE 列 名 ”比较 运算 符 列 值 
其 中 ,使 用 SELECT 语句 给 变量 赋值 时 ,如 果 省 略 了 FROM 子 句 和 WHERE 子 句 ， 


就 等 同 于 SET 语句 赋值 。 如 果 有 FROM 子 句 和 WHERE 子 句 , 若 SELECT 语句 返回 多 
个 值 , 则 将 返回 的 最 后 一 个 值 赋 给 局 部 变量 。SELECT 语句 的 赋值 功能 和 查询 功能 不 能 


混合 使 用 ,否则 系统 会 产生 错误 信息 。 


13.3.4 函数 


在 Transact-SQL 中 提供 了 丰富 的 函数 。 函 数 可 分 为 系统 函数 和 用 户 定义 函数 。 


1. 系统 函数 
1) 聚合 函数 


聚合 函数 用 于 对 一 组 数据 执行 某 种 计算 并 返回 一 个 结果 。 聚 合 函 数 经 常 在 


SELECT 语句 的 GROUP BY 子 句 中 使 用 。 除 了 COUNT 函数 之 外 ,其 他 聚合 函数 都 忽 
略 空 值 。 表 13. 3 对 聚合 函数 进行 了 简要 说 明 。 


表 13.3 常用 的 聚合 函数 


函 数 名 功 能 

AVG 返回 一 组 值 的 平均 值 

COUNT 返回 一 组 值 项 目的 数量 (返回 值 为 int 类 型 ) 

MAX 返回 表达 式 或 者 项 目 中 的 最 大 值 

MIN 返回 表达 式 或 者 项 目 中 的 最 小 值 

SUM 返回 表达 式 中 所 有 值 的 和 ,或 者 只 返回 DISTINCT 值 。SUM 只 能 用 于 数字 列 
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2) 数学 函数 

数学 函数 用 于 对 数字 表达 式 进行 数学 运算 并 返回 运算 结果 。 使 用 数学 函数 可 以 对 
SQL Server 提供 的 数字 数据 进行 运算 ,如 DECIMAL、 INTEGER、 FLOAT.、 REAL.、 
MONEY、SMALLMONEY、SMALLINT 和 TINYINT。 常 用 的 数学 函数 如 表 13. 4 


所 示 。 
表 13.4 常用 的 数学 函数 

数学 函数 描 述 

ABS 绝对 值 函数 ,返回 指定 数值 表达 式 的 绝对 值 

ACOS 反 余 弦 函 数 ,返回 其 余弦 值 是 指定 表达 式 的 角 ( 弧 度 ) 

ASIN 反正 弦 函 数 ,返回 其 正弦 值 是 指定 表达 式 的 角 ( 弧 度 ) 

ATAN 反正 切 函 数 ,返回 其 正切 值 是 指定 表达 式 的 角 ( 弧 度 ) 

ATAN2 反正 切 函 数 ,返回 其 正切 值 是 两 个 表达 式 之 商 的 角 ( 弧 度 ) 

CEILING 返回 大 于 或 等 于 指定 数值 表达 式 的 最 小 整数 ,与 FLOOR 函数 对 应 
COS 正 弦 函数 ,返回 指定 表达 式 中 以 弧度 表示 的 指定 角 的 余弦 值 
COT 余 切 函数 ,返回 指定 表达 式 中 以 弧度 表示 的 指定 角 的 余 切 值 
DEGREES 弧度 至 角度 转换 函数 ,返回 以 弧度 指定 的 角 的 相应 角度 ,与 RADIANS 函数 对 应 
EXP 指数 函数 ,返回 指定 表达 式 的 指数 值 

FLOOR 返回 小 于 或 等 于 指定 数值 表达 式 的 最 大 整数 ,与 CEILING 函数 对 应 
LOG 自然 对 数 函 数 ,返回 指 定 表达 式 的 自然 对 数值 

LOG10 以 10 为 底 的 常用 对 数 ,返回 指定 表达 式 的 常用 对 数值 
PI 圆周 率 函数 ,返回 14 位 小 数 的 圆周 率 常量 值 
POWER 徊 函数 ,返回 指定 表达 式 的 指定 竹 的 值 
RADIANS 角度 至 弧度 转换 函数 ,返回 指定 角度 的 弧度 值 ,与 DEGREES 函数 对 应 
RAND 随机 函数 ,随机 返回 0 一 1 的 float 数值 
ROUND 圆 整 函数 ,返回 一 个 数值 表达 式 , 并 且 舍 入 到 指定 的 长 度 或 精度 
SIGN 符号 函数 ,返回 指定 表达 式 的 正 号 、 零 或 负 号 
SIN 正 艾 函数 ,返回 指定 表达 式 中 以 弧度 表示 的 指定 角 的 正弦 值 
SQRT 平方 根 函 数 ,返回 指定 表达 式 的 平方 根 
SQUART 平方 函数 ,返回 指定 表达 式 的 平方 
TAN 正切 函数 ,返回 指定 表达 式 中 以 弧度 表示 的 指定 角 的 正切 值 

3) 字符 串 函 数 


字符 串 函 数 对 二 进 制 数据 .字符 串 和 表达 式 执 行 不 同 的 运算 。 此 类 函数 作用 于 
CHAR、VARCHAR、BINARY 和 VARBINARY 数据 类 型 以 及 可 以 隐 式 转换 为 CHAR 
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或 VARCHAR 的 数据 类 型 。 可 以 在 SELECT 语句 和 WHERE 子 句 以 及 表达 式 中 使 用 
字符 串 函 数 。 具 体 如 表 13. 5 所 示 。 


表 13.5 字符 串 函数 


字符 串 函 数 描 述 
ASCII ASCII 函数 ,返回 字符 串 表 达 式 中 最 左 端的 字符 的 ASCII 代码 值 
CHAR ASCII 代码 转换 函数 ,返回 指定 ASCII 代码 的 字符 


CHARINDEX “| 确定 字符 位 置 函数 ,返回 指定 字符 串 中 指定 表达 式 的 开始 位 置 
DIFFERENCE | 字符 串 差 异 函 数 ,返回 两 个 字符 表达 式 的 SOUNDEX 值 之 间 的 差别 
指 


LEFT 左 子 串 函 数 ,返回 指定 字符 串 中 从 左边 开始 指定 个 数 的 字符 

LEN 字符 串 长 度 函 数 ,返回 指 定 字 符 串 表达 式 中 字符 的 个 数 

LOWER 小 写字 母 函数 ,返回 指定 表达 式 的 小 写字 母 , 将 大 写字 母 转 换 为 小 写字 母 

LTRIM 删除 前 导 空 格 函数 ,返回 删除 了 前 导 空格 的 字符 表达 式 

NCHAR Unicode 字符 函数 ,返回 指定 整数 代码 的 Unicode 字符 

RN pba ren a 次 出 现 的 起 始 位 置 。0 表示 没有 


QUOTENAME | 返回 带 有 分 隔 符 的 Unicode 字符 串 


蔡 换 函数 ,用 第 三 个 表达 式 替 换 第 一 个 字符 串 表 达 式 中 出 现 的 所 有 第 二 个 指定 字 
符 串 表 达 式 的 匹配 项 


REPLICATE 复制 函数 ,以 指定 的 次 数 重复 字符 表达 式 
REVERSE 逆向 函数 ,返回 指定 字符 串 的 逆向 表达 式 


REPLACE 


RIGHT 右 子 串 函 数 ,返回 字 符 串 表达 式 中 从 右边 开始 指定 个 数 的 字符 
RTRIM 删除 尾随 空格 函数 ,返回 删除 所 有 尾随 空格 的 字符 表达 式 
SOUNDEX 相似 函数 ,返回 一 个 由 4 个 字符 组 成 的 代码 ,用 于 评估 两 个 字符 串 的 相似 性 
SPACE 空格 函数 ,返回 由 重复 的 空格 组 成 的 字符 串 
STR 数字 向 字符 转换 函数 ,返回 由 数字 转换 过 来 的 字符 串 
STUFF 插入 替代 函数 ,删除 指定 长 度 的 字符 ,并 在 指定 的 起 点 处 插入 另外 一 组 字符 
SUBSTRING 子 串 函数 ,返回 字符 表达 式 ,二进制 表达 式 等 的 指定 部 分 
UNICODE UNICODE 函数 .返回 指定 表达 式 中 第 一 个 字符 的 整数 代码 
UPPER 大 写 函 数 ,返回 指定 表达 式 的 大 写字 母 形式 
4) 转换 函数 


大 多 数 情况 下 ,SQL Server 能 够 自动 处 理 不 同 数据 类 型 之 间 的 转换 。 例 如 , 比较 
CHAR 和 DATETIME 表达 式 SMALLINT 和 INT 表达 式 , 或 不 同 长 度 的 CHAR 表达 
式 之 间 的 转换 。 这 种 转换 被 称 为 系统 自 带 的 隐 性 转换 。 但 是 , 当 SQL 不 能 自动 转换 或 自 
动 转换 的 结果 不 符合 要 求 时 ,就 需要 借助 转换 函数 来 实现 ,这 种 转换 称 为 显 式 转换 。 常 用 
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的 转换 函数 主要 是 CONVERT() 和 CAST()。 这 两 个 转换 函数 都 可 用 于 选择 列表 、 
WHERE 子 句 和 人 允许 使 用 表达 式 的 任何 地 方 。 
CAST() 函数 可 以 将 某 一 种 数据 类 型 强制 转换 为 男 一 种 数据 类 型 ,其 语法 格式 如 下 。 
CAST (表达 式 Rs 数据 类 型 ) 


CONVERT() 函 数 允 许 用 户 把 表达 式 从 一 种 数据 类 型 转换 为 另 一 种 数据 类 型 ,并且 
还 在 日 期 的 不 同 显示 格式 之 间 进 行 转换 ,其 语法 格式 如 下 。 


CONVERT (< 数据 类 型 > [ (< 长 度 >)],< 表 达 式 > [,< 格 式 >]) 


5) 日 期 和 时 间 函 数 
日 期 和 时 间 函 数 用 于 对 日 期 和 时 间 型 数据 进行 各 种 不 同 的 运算 处 理 ,其 结果 可 以 是 
字符 型 .数值 型 和 日 期 /时 间 型 数据 。 在 SQL Server 中 ,常用 的 日 期 和 时 间 函 数 如 


表 13.6 所 示 。 
表 13.6 日 期 和 时 间 函 数 

日 其 和 时 间 函 数 描 述 
DATEADDO) 返回 给 指定 日 期 加 上 一 个 时 间 间 隔 后 的 新 datetime 值 
DATEDIFF() 返回 两 个 指定 日 期 的 日 期 边界 数 和 时 间 边 界 数 
DATENAME() 返回 表示 指定 日 期 的 指定 日 期 部 分 的 字符 串 
DATEPARTO) 返回 表示 指定 日 期 的 指定 日 期 部 分 的 整数 
DAYO) 返回 指定 日 期 的 “天 ?部 分 的 整数 
GETDATE() 以 标准 格式 返回 当前 系统 的 日 期 和 时 间 
GETUTCDATE() 返回 当前 UTC 日 期 和 时 间 
MONTHO 返回 指定 日 期 的 “月 "部 分 的 整数 
YEAR(O) 返回 指定 日 期 的 “年 "部 分 的 整数 

2. 用 户 自 定义 函数 


SQL Server 不 仅 提 供 了 大 量 的 内 置 函 数 ,而 且 允 许 用 户 根据 需要 创建 自 定义 函数 。 
用 户 自 定义 函数 是 由 一 个 或 多 个 Transact-SQL 语句 组 成 的 子 程序 , 它 接收 参数 ,返回 操 
作 结 果 , 返 回 值 可 以 是 单个 的 标量 值 或 结果 集 。 因 此 ,用 户 自 定义 函数 可 分 为 标量 函数 和 
表 值 函数 。 其 中 , 表 值 函数 又 可 分 为 内 联 表 值 函 数 和 多 语句 表 值 函数 。 


13.3.5 批 处 理 和 流程 控制 
在 SQL Server 中 ,可 以 使 用 批 处 理 和 流程 控制 语句 来 实现 相应 的 功能 。 批 处 理 是 包 


含 一 个 或 多 个 Transact-SQL 语句 的 组 ,从 应 用 程序 一 次 性 地 发 送 到 SQL Server 执行 。 
流程 控制 语句 用 来 控制 SQL 语句 、 语 句 块 或 者 存储 过 程 的 执行 流程 。 
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1. 批 处 理 


当 用 户 用 TransactSQL 编写 程序 时 ,可 以 利用 批 处 理 语句 来 提高 程序 的 执行 效率 。 
批 处 理 是 使 用 GO 语句 将 多 条 SQL 语句 进行 分 隔 ,其 中 每 两 个 GO 之 间 的 SQL 语句 就 
是 一 个 批 处 理 单元 。 一 个 批 处 理 中 可 以 包含 一 条 语句 ,也 可 以 包含 多 条 语句 。 在 SQL 
Server 执行 批 处 理 之 前 首先 将 批 处 理 语句 进行 编译 ,使 之 成 为 一 个 可 执行 单元 ,然后 再 对 
编译 成 功 的 批 处 理 单元 进行 处 理 。 如 果 批 处 理 中 某 条 语句 编译 出 现 错误 (如 语法 错误 )， 
则 使 整个 执行 计划 无 法 编译 成 功 ,从 而 导致 批 处 理 中 的 任何 语句 均 无 法 执行 。 如 果 批 处 
理 语句 在 运行 时 出 错 ( 如 算术 溢出 或 违反 约束 ), 则 会 产生 以 下 影响 。 

(1) 大 多 数 进行 时 错误 将 停止 执行 批 处 理 中 当前 语句 和 它 之 后 的 语句 。 

(2) 少数 运行 时 错误 (如 违反 约束 ) 仅 停止 执行 当前 语句 ,而 继续 进行 批 处 理 中 其 他 
所 有 语句 。 

(3) 在 遇 到 运行 时 错误 之 前 执行 的 语句 不 受 影响 ,除非 批 处 理 在 事务 中 而 且 错 误导 
致 事务 回 滚 。 

例如 ,在 批 处 理 中 有 10 条 语句 。 如 果 第 5 条 语句 中 有 一 个 语法 错误 , 则 不 执行 批 处 
理 中 的 任何 语句 。 如 果 编 译 了 批 处 理 ,而 第 2 条 语句 在 执行 时 失败 , 则 第 1 条 语句 的 结果 
不 受 影响 ,因为 它 已 经 执行 了 。 

使 用 批 处 理 时 ,应 注意 以 下 规则 。 

(1) CREATE DEFAULT、CREATE PROCEDURE CREATE RULE、CREATE 
TRIGGER CREATE VIEW 语句 不 能 在 批 处 理 中 与 其 他 语句 组 合 使 用 。 批 处 理 必须 以 
CREATE 语句 开始 ,所 有 跟 在 批 处 理 后 的 其 他 语句 将 被 解释 为 第 一 个 CREATE 语句 定 
义 的 一 部 分 。 

(2) 不 能 在 同一 个 批 处 理 中 更 改 表 , 然 后 引用 新 列 。 

(3) 在 编写 批 处 理 语句 时 ,需要 使 用 GO 语句 作为 批 处 理 命令 的 结束 标识 。 


2. 流程 控制 语句 


流程 控制 语句 是 用 来 控制 程序 执行 和 流程 分 支 的 语句 。 在 SQL Server 中 ,可 以 使 用 
的 流程 控制 语句 有 BEGIN … END. IF… ELSE、 CASE、 WHILE:… CONTINUE … 
BREAK、GOTO、WAITFOR、RETURN 等 。 

1) 语句 块 

一 组 Transact-SQL 语句 作为 一 个 单元 执行 称 为 语句 块 。 关 键 字 BEGIN 用 于 标志 
语句 块 的 起 始 ,关键 字 END 用 于 标志 语句 块 的 结束 ,BEGIN 和 END 是 流程 控制 语句 的 
关键 字 ,其 语法 格式 如 下 。 

BEGIN 

语句 
END 


在 条 件 语句 和 循环 语句 等 流程 控制 语句 中 , 当 符 合 特定 条 件 需 要 执行 两 个 或 多 个 语 
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句 时 ,就 应 该 使 用 BEGIN…END 语句 将 这 些 语句 组 合 在 一 起 。 
2) 条 件 语句 
条 件 语句 用 于 控制 批 处 理 中 的 条 件 执行 。IF…ELSE 语句 是 条 件 判断 语句 。 如 果 IF 
后 面 给 出 的 条 件 满足 (布尔 表达 式 返 回 TRUE) , 则 执行 IF 关键 字 之 后 的 Transact-SQL 
语句 , 若 不 满足 , 则 执行 ELSE 后 面 的 语句 ,但 ELSE 关键 字 是 可 选 的 ,其 语法 形式 如 下 。 
IF 条 件 表达 式 1 
语句 
[ELSE [ IF 条件 表达 式 2 ] 
语句 
] 
其 中 ， 
(1) 条 件 表达 式 : 返回 TRUE 或 FALSE 的 布尔 表达 式 。 如 果 布 尔 表 达 式 中 含有 
SELECT 语句 ,必须 用 圆 括号 将 SELECT 语句 括 起 来 。 
(2) 语句 : Transact-SQL 语句 或 用 语句 块 定义 的 语句 分 组 。 除 非 使 用 语句 块 ,否则 
IF 或 ELSE 条 件 只 能 影响 一 个 Transact-SQL 语句 性 能 。 如 果 在 IF…ELSE 块 IF 区 和 
ELSE 区 都 使 用 了 CREATE TABLE 语句 或 SELECT INTO 语句 ,那么 CREATE 
TABLE 语句 或 SELECT INTO 语句 必须 指向 相同 的 表 名 。 
IF…ELSE 可 以 用 在 批 处 理 , 存 储 过 程 (经 常 使 用 这 种 结构 测试 是 否 存在 着 某 个 参 
数 ) 以 及 特殊 查询 中 。 可 以 在 其 他 IF 之 后 或 ELSE 下 面 嵌 套 另 一 个 IF 测试 ,对 于 髋 套 层 
数 没有 限制 。 
3) 分 支 语 句 
分 支 语句 CASE 是 用 于 多 重 选择 的 条 件 判 断 语句 ,结果 返回 单个 值 。 在 CASE 语句 
中 可 根据 表达 式 的 值 选择 相应 的 结果 。CASE 语句 通常 是 使 用 可 读 性 更 强 的 值 蔡 换 代码 
或 缩写 。CASE 语句 根据 使 用 的 格式 不 同 可 分 为 简单 CASE 语句 和 搜索 CASE 语句 ,两 
种 格式 都 支持 可 选 的 ELSE 参数 。 
(1) 简单 CASE 语句 。 简 单 CASE 语句 先 计算 CASE 后 面 的 表达 式 的 值 ,然后 将 其 
与 WHEN 后 面 的 表达 式 逐 个 进行 比较 , 若 相等 则 返回 THEN 后 面 的 表达 式 , 和 否则 返回 
ELSE 后 面 的 表达 式 ,其 语法 形式 如 下 。 
CASE 表达 式 
WHEN 分 支 条 件 表达 式 1 THEN 候选 值 表达 式 1 
[ [ WHEN 分 支 条 件 表达 式 2 THEN 候选 值 表达 式 2 ] 
| 
[ ELSE 候选 值 表 达 式 N ] 
END 
其 中 ， 
Q@ 表达 式 : 使 用 简单 CASE 格式 时 所 计算 的 表达 式 。 
@ 分 支 条 件 表达 式 : 使 用 简单 CASE 格式 时 与 表达 式 比 较 的 每 个 分 支 条 件 表达 式 。 
二 者 的 数据 类 型 必须 相同 ,或 者 是 可 以 隐 性 转换 。 
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@ N: 表明 可 以 使 用 多 个 WHEN 分 支 条 件 表达 式 THEN 候选 值 表 达 式 子 句 。 
【 例 13. 16】 将 成 绩 表 Score 中 的 学 生 所 选课 的 课程 号 蔡 换 成 课程 名 称 显 示 。 


SELECT sno cno=CASE cno 
WHEN '001' then ' 高 等 数学 ' 
WHEN '002' then ' 离 散 数学 ' 
WHEN "003' then ' 计 算 机 原理 ' 
WHEN '004' then 'C 语言 程序 设计 ' 
WHEN '005' then ' 数 据 结构 ， 
WHEN '006' then ' 数 据 库 系统 原理 ' 
WHEN '007' then "计算 机 网 络 ' 
ELSE ' 移 动 电子 商务 ' 
END, score 


FROM Score 


(2) 搜寻 CASE 语句 。 按 指定 顺序 对 每 个 WHEN 子 句 后 面 的 逻辑 表达 式 进行 计算 , 返 
回 第 一 个 计算 结果 为 TRUE 的 THEN 后 面 的 表达 式 。 若 所 有 的 逻辑 表达 式 都 为 假 , 则 返回 
ELSE 后 面 的 表达 式 ; 若 没有 指定 ELSE 子 句 , 则 返回 NULL 值 。 其 语法 形式 如 下 。 


CASE 
WHEN 分 支 条 件 逻 辑 表达 式 1 THEN 候选 值 表达 式 1 
[ [WHEN 分 支 条 件 逻 辑 表达 式 2 THEN 候选 值 表 达 式 2 ] 
Ee 
[ ELSE 候选 值 表达 式 N ] 
END 
其 中 ,分 支 条 件 逻辑 表达 式 是 使 用 CASE 搜索 格式 时 所 计算 的 布尔 表达 式 。 其 他 各 
项 的 说 明 参 见 简单 CASE 语句 。 
【 例 13.17】 将 成 绩 表 Score 中 的 学 生 所 选课 的 合格 成 绩 按 照 如 下 要 求 显 示 : 当成 
绩 大 于 或 等 于 90 时 ,显示 “ 优 ”; 当成 绩 大 于 或 等 于 80 时 ,显示 “ 良 ”; 当成 绩 大 于 或 等 于 
70 时 ,显示 “中 ”; 当 成 绩 大 于 等 于 60 时 ,显示 “及 ”。 
SELECT sno, cno Score = 
CRSE 
WHEN score >=90 then ' 优 ' 
WHEN score >=80 then ' 良 ' 
WHEN score >=70 then ' 中 ' 
ELSE ' 及 ' 
END 
FROM Score 
WHERE score >=60 


4) 循环 语句 
WHILE 语句 是 SQL 中 的 循环 语句 ,用 来 重复 执行 SQL 语句 或 语句 块 。 如 果 
WHILE 后 面 的 逻辑 表达 式 为 真 , 则 重复 执行 循环 内 部 的 语句 。 其 语法 形式 如 下 。 
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WHILE < 逻辑 表达 式 > 


<SQL 语句 > 
定义 WHILE 语句 时 必须 小 心 ,如 果 WHILE 语句 的 逻辑 表达 式 取 值 一 直 为 TRUE， 
WHILE 语句 将 进入 死 循环 。 


【 例 13. 18〗 用 WHILE 循环 语句 计算 100 内 所 有 整数 的 和 。 


DECLARE @mysum int, @i int 
SELECT @mysum =0 
SELECT @i=1 
WHILE @i<=100 

BEGIN 

SET @mysum =@mysum +@i 
SET @i=@i+1 

END 

PRINT @mysum 


输出 结果 为 : 5050。 

5) 等 候 语句 

WAITFOR 语句 用 于 暂停 正在 执行 的 语句 .语句 块 ,或 者 调用 存储 过 程 ,直到 某 时 
间 、 时 间 间 隔 到 达 后 才 继续 执行 。 其 语法 形式 如 下 。 


WRITEFOR { DELAY < ' 时 间 '>1 TIME < ' 时 间 '>} 


其 中 ,DELAY 关键 字 表示 等 候 由 “时 间 ” 参 数 指定 的 时 间 间 隔 ,完成 WAITFOR 语 
句 之 前 等 待 的 时 间 最 多 为 24 小 时 。TIME 关键 字 表 示 等 候 到 指定 的 “时 间 ” 为 止 ,其 数据 
类 型 是 有 效 的 datetime, 格 式 为 hh: mm: ss, 不 允许 有 日 期 部 分 。 

6) RETURN 语句 

RETURN 语句 用 于 无 条 件 终止 查询 ,存储 过 程 或 批 处 理 。 存 储 过 程 或 批 处 理 中 
RETURN 语句 后 面 的 语句 都 不 执行 。 当 在 存储 过 程 中 使 用 RETURN 语句 时 ,此 语句 可 
以 指定 返回 给 调用 应 用 程序 、 批 处 理 或 过 程 的 整数 值 。 如 果 RETURN 未 指定 值 , 则 存储 
过 程 返回 0。 对 于 大 多 数 存储 过 程 来 说 ,使 用 返回 代码 可 以 表示 存储 过 程 的 成 败 。 没 有 
发 生 错 误 时 ,存储 过 程 返回 值 0; 任 何 非 零 值 表 示 有 错误 发 生 。 

其 语法 形式 如 下 。 

RETURN { 整 型 表达 式 } 

一 般 情 况 下 ,只 有 存储 过 程 中 才 会 用 到 返回 的 整 型 结果 ,调用 存储 过 程 的 语句 可 以 根 
据 RETURN 返回 的 值 ,判断 下 一 步 应 该 执行 的 操作 。 


13.4 游标 


游标 是 一 个 在 结果 集中 可 以 移动 的 指针 , 它 可 以 指向 结果 集中 的 任意 位 置 ,允许 用 户 
对 指定 位 置 的 数据 进行 处 理 。 游 标 向 数据 库 发 送 查询 ,得 到 一 个 记录 和 集 ,但 游标 一 次 只 返 
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回 一 个 记录 行 。 若 对 SELECT 语句 返回 的 结果 值 进行 逐 行 处 理 , 必 须 使 用 游标 。 可 对 游 
标的 当前 位 置 进行 更 新 查询 和 删除 ,使 用 游标 需要 经 历 以 下 5 个 步骤 。 

(1) 定义 游标 : DECLARE。 

(2) 打开 游标 : OPEN 。 

(3) 逐 行 提取 游标 集中 的 行 : FETCH。 

(4) 关闭 游标 : CLOSE。 

(5) 释放 游标 : DEALLOCATE。 


13.4.1 游标 的 使 用 


1. 定义 游标 
定义 游标 的 语法 为 : 


DECLARE <cursorName>CURSOR 
FOR <SQL- Statements> 
[ FOR { READ ONLY | UPDATE [OF <columnName list>] } ] 


在 使 用 游标 之 前 ,必须 先 定义 游标 。 其 中 。 

(1) 王 cursorName 二 : 定义 的 游标 名 称 。 

(2) 二 SQL-Statements 二 : 游标 要 实现 的 功能 程序 。 

(3) 一 columnName_list 二 : 属性 列 名 列表 。 

(4) [ FOR { READ ONLY | UPDATE [OF <columnName_list>] } ]: READ 
ONLY 表示 当前 游标 集中 的 元 组 仅 可 以 查询 ,不 能 修改 ;UPDATE [OF 所 columnName_ 
list>] 表 示 可 以 对 当前 游标 集中 的 元 组 进行 更 新 操作 。 如 果 有 OF 二 columnName_list>， 
表示 仅 可 以 对 游标 集中 指定 的 属性 列 进行 更 新 操作 ;默认 为 UPDATE。 


2. 打开 游标 


游标 定义 后 ,如 果 要 使 用 游标 ,必须 先 打开 游标 。 打 开 游标 操作 表示 : 系统 按照 游标 
的 定义 从 数据 库 中 将 数据 检索 出 来 , 放 在 内 存 的 游标 集中 (如 果 内 存 不 够 ,会 放 在 临时 数 
据 库 中 ) ,并 为 游标 集 指定 一 个 游标 ,该 游标 指向 游标 集中 的 第 一 个 元 组 。 打 开 游 标的 语 
法 为 : 


OPEN <cursorName> 
3. 获取 当前 游标 值 
要 对 当前 游标 所 指向 的 元 组 进行 操作 ,必须 获取 当前 游标 所 指向 的 元 组 ,其 语法 是 : 


FETCH <cursorName>INTO <@variableName list> 


执行 一 次 该 语句 ,系统 将 当前 游标 所 指向 的 元 组 属性 值 放 到 变量 中 ,然后 游标 自动 下 
移 一 个 元 组 。 当 前 游标 所 指向 元 组 的 每 个 属性 值 必须 分 别 用 一 个 变量 来 接收 , 即 变量 个 
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数 、 数 据 类 型 必须 与 定义 游标 中 的 SELECT 子 句 所 定义 的 属性 (或 表达 式 ) 个 数 、 数 据 类 
型 相 一 致 。 当 游标 移 至 尾部 ,不 可 再 读 取 游 标 , 必 须 关 闭 游标 然后 重新 打开 游标 。 


通过 检查 全 局 变量 @@FETCH_STATUS 来 判断 是 否 已 读 完 游标 集中 的 所 有 行 。 


@@FETCH_STATUS 的 值 有 以 下 几 个 。 
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0: FETCH 语句 成 功 , 表 示 已 经 从 游标 集中 获取 了 元 组 值 。 

一 1: FETCH 语句 失败 或 此 行 不 在 结果 集中 。 

一 2: 被 提取 的 行 不 存在 。 

4. 关闭 游标 

游标 不 使 用 时 ,必须 关闭 ,其 语法 为 : 

CLOSE <cursorName> 

在 一 个 批 处 理 中 ,可 以 多 次 打开 和 关闭 游标 。 

5. 释放 游标 所 占用 的 空间 

关闭 游标 ,并 没有 释放 游标 所 占用 的 内 存 和 外 存 空间 ,必须 释放 游标 ,其 语法 为 : 
DEALLOCATE <cursorName> 

当 释 放 完 游标 之 后 ,如 果 要 重新 使 用 这 个 游标 , 则 必须 重新 执行 声明 游标 的 语句 。 
6. 变量 赋值 与 表达 式 显 示 

变量 赋值 语句 的 语法 为 : 

SET <@variableName>=<expr> 

变量 列表 赋值 语句 的 语法 为 : 


SELECT <@variableName> [=<expr | columnName>] 


[, <@variableName> [=<expr | columnName>] … ] 
表达 式 列表 显示 语句 的 语法 为 : 
SELECT <expr> [<aliasName>] [, <expr> [<aliasName>] … ] 


【 例 13. 19】 创建 一 个 游标 , 逐 行 显 示 每 个 班级 的 班级 编号 .班级 名 称 和 所 属 年 级 。 


/* 定义 变量 及 赋 初 值 * / 
DECLARE @classNo char (10), @className char (30) ，Qgrade int 
-定义 游标 
DECLARE c¢ class CURSOR FOR 
SELECT classNo, className, grade 
FROM Class 
OPEN c_class -- 打 开 游 标 ,游标 指向 查询 结果 集 的 第 一 个 元 组 
-- 获 取 当 前 游标 的 值 放 到 变量 eclassNo .eclassName 和 egrade 中 
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FETCH c_class INTO @classNo,@className,@grade -- 获 取 第 一 个 元 组 ,游标 下 移 
WHILE @@FETCH STATUS =0 
BEGIN 


PRINT ' 班 级 号 是 :' +@classNo + ' 班 级 名 称 是 :' +@className + ' 年 级 是 :' +CONVERT 
(CHAR, @ grade) 


FETCH c_class INTO @classNo,@className,@grade -- 获 取 游 标 所 指向 元 组 ,并 下 移 

END 

CLOSE c class -关闭 游标 

DEALLOCATE c_class =-- 释 放 游标 

【 例 13.20】 创建 一 个 游标 , 逐 行 显示 选修 了 * 数 据 库 系统 原理 "课程 的 学 生 姓名 、 相 
应 成 绩 和 该 课程 的 平均 分 。 

分 析 : 

(1) 选修 “数据 库 系统 原理 ”课程 的 同学 可 能 不 止 一 个 ,需要 使 用 游标 查询 选修 该 门 
课程 的 学 生 姓名 和 相应 的 选课 成 绩 。 

定义 游标 为 : 


DECLARE myCur CURSOR FOR 
SELECT sname score 
FROM Student a,Course b,Scorec 
WHERE a.sno=c.sno 
AND b.cno=c.cno 


AND cname=' 数 据 库 系统 原理 ' 

(2) 要 获得 该 课程 的 平均 分 ,必须 首先 计算 选课 人 数 和 总 分 ,定义 计数 器 和 累加 器 变 
量 @countScore、@sumScore, 初 始 值 为 0。 

(3) 定义 两 个 变量 @sName 和 @score, 用 于 接收 游标 集中 当前 游标 中 的 学 生 姓 名 和 
相应 的 选课 成 绩 。 

(4) 由 于 FETCH 命令 每 次 仅 从 游标 集中 提取 一 条 记录 ,必须 通过 一 个 循环 来 重复 
提取 ,直到 游标 集中 的 全 部 记录 被 提取 。 全 局 变量 @@FETCH_STATUS 用 于 判断 是 否 
正确 地 从 游标 集中 提取 到 了 记录 ,@@FETCH_STATUS==0 表示 已 经 正确 提取 到 了 游 
标记 录 。 循 环 语句 为 : WHILE (@@FETCH_STATUS=0)。 

(5) 在 循环 体内 ,首先 显示 所 提取 到 的 学 生 姓 名 和 相应 的 选课 成 绩 , 使 用 语句 ，: 

SELECT @ sName 学 生 姓名 ，@ score 课程 成 绩 

其 次 ,计数 器 @countScore 进行 计数 ,并 将 提取 到 的 成 绩 累加 到 变量 @sumScore 中 。 
语句 为 : 


SET @ sumScore=@ sumScore+@score -- 计 算 总 分 
SET @countscore=@countSscore+1 -- 计 算 选 课 人 数 


最 后 ,提取 下 一 条 游标 记录 ,重复 (5) ,直到 全 部 游标 记录 处 理 完毕 ,退出 循环 。 
(6) 处 理 完全 部 游标 记录 后 ,关闭 和 释放 游标 ,同时 对 计数 器 @countScore 进行 判 
断 : 如 果 为 0, 表示 没有 同学 选修 ,其 平均 分 为 0; 和 否则 ,平均 分 等 于 总 分 除 以 选课 人 数 。 


249 


完整 


元 至 


性 


数据 结构 与 数据 库 应 用 教程 


(7) 程序 如 下 。 


DECLARE @ sName varchar (20), @score tinyint, 
@sumSscore int, @countSscore smallint 
SET @ sumScore=0 
SET @countScore=0 
DECLARE myCur CURSOR FOR 
SELECT sname, score 
FROM Student a,Course b,Scorec 
WHERE a.sno=c.sno 
AND b.cno=c.cno 
AND cname=' 数 据 库 系统 原理 ' 
OPEN myCur 
FETCH myCur INTO @sName,@ score 
WHILE (@@FETCH STATUS=0) 


BEGIN 
SELECT @ sName 学 生 姓名 ,@ score 成 绩 
SET @ sumScore=@ sumScore+@score -- 计 算 总 分 
SET @countSscore=@countscore+l1 -- 计 算 选 课 人 数 


FETCH myCur INTO @ sName,@ score 

END 
IF @countscore>0 

SELECT @ sumScore/@countScore 课程 平均 分 
ELSE 

SELECT 0.00 课程 平均 分 
CLOSE myCur 
DEALLOCATE myCur 


13.4.2 当前 游标 集 的 修改 


到 该 
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可 以 对 当前 游标 集中 的 元 组 执行 删除 和 更 新 操作 。 

1. 删除 游标 集中 当前 行 

语法 : 

DELETE FROM <tableName>WHERE CURRENT OF <cursorName> 

从 游标 中 删除 一 行 后 ,游标 定位 于 被 删除 游标 的 下 一 行 ,但 还 需要 用 FETCH 语句 得 
行 的 值 。 

【 例 13.21】 把 Score 表 学 号 为 “201825011? 的 成 绩 为 空 的 选课 记录 逐条 删除 。 


DECLARE @ sno char (9) ,cno char (3) ,escore decimal 
DECLARE C_stu CURSOR FOR 


SELECT sno cno, score 
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FROM Score 
WHERE sno= "201825011" 
OPEN c¢ stu 
FETCH ¢ stu into @sno, @cno, @score 
WHILE @@FETCH STATUS =0 
BEGIN 
if @score IS NULL 
DELETE FROM Score 
WHERE CURRENT OF ¢ _ stu 
-- 删 除 当 前 游标 获取 值 的 元 组 ,并 且 游 标 指向 下 一 元 组 
FETCH c_stu into @sno, @cno, @score 
END 
CLOSE c stu 
DEALLOCATE c¢ stu 


2. 更 新 游标 集中 当前 行 
语法 : 


UPDATE <tableName> 
SET <columnName>=<expr> [, <columnName>=<expr>"* ] 


WHERE CURRENT OF <cursorName> 
【 例 13.22】 把 选修 了 课程 号 为 "001? 的 成 绩 逐 行 修改 为 除 3 加 50。 


DECLARE @sno char (9) ,QQcno char (3),@score decimal 
DECLARE C_score CURSOR FOR 
SELECT sno, cno, score 
FROM Score 
WHERE cno= "001" 
FOR UPDATE OF score 
OPEN c_score 
FETCH c_score into @sno, @cno, @score 
WHILE @@FETCH_ STATUS =0 
BEGIN 
UPDATE Score 
SET score=score/3+50 
WHERE CURRENT OF ¢_score 
-修改 当 前 游标 获取 值 的 元 组 ,并 且 游 标 指向 下 一 元 组 
SELECT @ sno, @cno, @score 
FETCH c_score into @sno, @cno, @score 
END 
CLOSE c¢ _ score 


DEALLOCATE ¢_ score 
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13.5 存储 过 程 


在 SQL Server 应 用 程序 开发 中 ,开发 人 员 使 用 存储 过 程 可 以 提高 应 用 程序 的 设计 效 
率 , 增 强 系统 的 安全 性 。 本 节 将 详细 介绍 存储 过 程 的 定义 、 特 点 和 类 型 等 内 容 。 


13.5.1 存储 过 程 概述 


存储 过 程 是 为 了 完成 特定 功能 汇集 而 成 的 一 组 命名 了 的 SQL 语句 集合 ,是 利用 SQL 
Server 提供 的 Transact-SQL 所 编写 的 程序 ,该 集合 编译 后 存放 在 数据 库 中 ,可 根据 实际 情况 
重新 编译 。 存 储 过 程 可 直接 运行 ,也 可 远程 运行 ,存储 过 程 直接 在 服务 器 端 运行 。 

使 用 存储 过 程 具有 如 下 优点 。 

(1) 将 业务 操作 封装 。 可 以 为 复杂 的 业务 操作 编写 存储 过 程 , 放 在 数据 库 中 。 一 个 
存储 过 程 一 旦 成 功 创建 , 便 可 以 在 程序 中 被 任意 重复 地 调用 ,这 样 就 提高 了 程序 的 重用 性 
和 共享 性 ,增强 了 程序 的 可 维护 性 ,从 而 大 大 提高 程序 的 设计 效率 。 用 户 可 以 调用 存储 过 
程 执行 ,而 业务 操作 对 用 户 是 不 可 见 的 。 若 存储 过 程 仅 修改 了 执行 体 ,而 没有 修改 接口 
( 即 调用 参数 ) , 则 用 户 程序 不 需要 修改 ,达到 业务 封装 的 效果 。 

(2) 实现 一 定 程度 的 安全 性 保护 。 由 于 存储 过 程 存放 在 数据 库 中 , 且 在 服务 器 端 运 
行 ,因此 ,对 于 那些 不 允许 用 户 直 接 操 作 的 表 或 视图 ,可 通过 调用 存储 过 程 来 间接 地 访问 
这 些 表 或 视图 ,从 而 达到 一 定 程度 的 安全 性 。 这 种 安全 性 源 于 用 户 对 存储 过 程 只 有 执行 
权限 ,没有 查看 权限 。 拥 有 了 存储 过 程 的 执行 权限 ,就 自动 获取 了 存储 过 程 中 对 相应 表 或 
视图 的 操作 权限 ,但 这 些 操 作 权 限 仅 能 通过 执行 存储 过 程 来 实现 ,一 旦 脱离 存储 过 程 ,也 
就 失去 了 相应 操作 权限 。 

(3) 提高 操作 的 执行 速度 。 由 于 存储 过 程 在 服务 器 端 存储 和 运行 ,并 且 第 一 次 执行 
后 在 内 存 中 保留 ,以 后 调用 时 不 需要 再 次 从 磁盘 装载 ,能 够 实现 更 快 的 执行 速度 。 

(4) 减少 网 络 通信 量 。 存 储 过 程 仅 在 服务 器 端 执行 ,客户 端 只 接收 结果 。 如 果 有 一 
千 条 Transact-SQL 语句 的 命令 ,逐条 地 通过 网 络 在 客户 端 和 服务 器 之 间 传 送 ,那么 这 种 
传输 将 耗费 较 长 的 时 间 ;但 是 ,如 果 把 这 一 千 条 Transact-SQL 语句 的 命令 组 织 成 一 个 存 
储 过 程 并 存储 在 服务 器 端 ,这 时 ,用户 调用 存储 过 程 只 需 在 客户 端 发 一 条 调用 命令 即 可 ， 
从 而 大 大 减少 了 客户 端 和 服务 器 之 间 的 网 络 通 信 流 量 。 

使 用 存储 过 程 前 ,首先 要 创建 存储 过 程 。 可 以 对 存储 过 程 进行 修改 和 删除 ,创建 存储 
过 程 后 ,必须 对 存储 过 程 授予 执行 EXECUTE 的 权限 ,否则 该 存储 过 程 仅 可 以 供 创 建 者 
执行 。 


13.5.2 创建 和 执行 存储 过 程 


1. 创建 存储 过 程 
用 户 自 定义 存储 过 程 需要 用 户 在 数据 库 中 先 成 功 创建 ,然后 才能 被 执行 。 在 创建 和 
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执行 存储 过 程 中 需要 满足 一 定 的 约束 和 规则 。 本 节 将 分 别 介 绍 如 何在 图 形 界面 下 和 
Transact-SQL 语句 环境 下 来 创建 执行 存储 过 程 。 

1) 用 Transact-SQL 语句 创建 不 带 参数 的 存储 过 程 

用 Transact-SQL 语句 创建 不 带 参数 的 存储 过 程 语法 格式 如 下 。 


CREATE PROCEDURE <procedureName> 
RS 
<SQL- StatementsS> 


其 中 ,procedureName 表示 要 创建 的 存储 过 程 的 名 字 ,SQL-Statements 表示 SQL 语句 。 
【 例 13.23】 创建 一 个 名 为 searchStu 的 不 带 参 数 的 存储 过 程 ,该 存储 过 程 查询 全 部 
学 生 的 学 号 、 姓 名 和 性 别 。 
CREATE PROCEDURE searchStu 
AS 
SELECT sno, sname, sex FROM Student 


2) 用 Transact-SQL 语句 创建 带 参 数 的 存储 过 程 
用 Transact-SQL 语句 创建 带 参 数 的 存储 过 程 语 法 格式 如 下 。 


CREATE PROCEDURE <procedureName> 

[(<@parameterName><datatype> [=<defaultValue>] [OUTPUT] 

[, <@parameterName><datatype> [=<defaultValue>] [OUTPUT] ] ) ] 
RS 

<SQL- StatementS> 


其 中 ， 

(1) 过 procedureName 二 : 过 程 名 ,必须 符合 标识 符 规 则 , 且 在 数据 库 中 唯一 。 

(2) 过 @parameterName>: 参数 名 ,存储 过 程 可 不 带 参数 ,参数 可 以 是 变量 常量 和 
表达 式 。 

(3) 过 defaultValue 之 : 用 于 指定 参数 的 默认 值 。 

(4) OUTPUT: 说 明 该 参数 是 输出 参数 ,被 调用 者 获取 使 用 。 缺 省 时 表示 是 输入 
参数 。 
【 例 13.24】 输入 某 个 同学 的 学 号 ,统计 该 同学 的 姓名 和 平均 分 。 
CREATE PROCEDURE ProStuBVYNo (@ sNo char (9) ) 

RS 
SELECT sname, avg (score) 
FROM Student a, Score b 
WHERE a.sno=b.sno 
AND a.sno=@sNo 
GROUP BY sname 


【 例 13.25】 输入 某 个 同学 的 学 号 ,统计 该 同学 的 平均 分 ,并 返回 该 同学 的 姓名 和 平 
均 分 。 
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该 过 程 涉及 三 个 参数 : 一 个 输入 参数 , 设 为 @sNo, 用 于 接收 某 同学 的 学 号 ;两 个 输出 


参数 ,用 于 返回 查询 到 的 同学 姓名 和 平均 分 , 设 为 @sName 和 @avg。 


实现 方法 如 下 。 


CREATE PROCEDURE proStuByNoo (@sNo char(9), @sName varchar (20) OUTPUT, 
@avg numeric(5, 1) OUTPUT ) 
RS 
BEGIN 
- -查询 同学 的 姓名 放 入 输出 参数 esName 中 
SELECT @ sName= sname 
FROM Student 
WHERE sno=@sNo 
-- 查 询 同学 选课 的 平均 分 放 入 输出 参数 @avg 中 
SELECT @avg=avg (score) 
FROM Score 
WHERE sno=@sNo 
GROUP BY sno 
END 


2. 执行 存储 过 程 
使 用 存储 过 程 时 ,必须 执行 命令 EXECUTE, 语 法 如 下 。 


EXECUTE <procedureName> 
[ [<@parameterName>=] <expr>, 
[<@parameterName>=] <@variableName> [OUTPUT] 
[, [<@parameterName>=] <expr>, 


[<@parameterName>=] <@variableName> [OUTPUT] ] ] 


EXECUTE 的 参数 必须 与 对 应 的 PROCEDURE 的 参数 相 匹配 。 
【 例 13.26】 执行 存储 过 程 searchStu。 


EXECUTE searchStu 

【 例 13. 27〗 执行 存储 过 程 proStuByNo。 
EXECUTE ProStuBYNo '201822001' 

【 例 13.28】 执行 存储 过 程 proStuByNoo。 


DECLARE Q sName varchar (20), @avg numeric(5，1) 
EXECUTE proStuByNoo '201822001', @sName OUTPUT, @avg OUTPUT 
SELECT @ sName, @avg 


13.5.3 修改 和 删除 存储 过 程 
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通过 这 些 方式 来 管理 存储 过 程 。 
1. 修改 存储 过 程 
使 用 ALTER PROCEDURE 语句 同样 可 以 完成 存储 过 程 的 修改 。 其 语法 格式 如 下 。 


让 


y 


ALTER PROCEDURE <procedureName> 

[<@parameterName><datatype> [=<defaultValue>] [OUTPUT] 

[, <@parameterName><datatype> [=<defaultValue>] [OUTPUT] ] ] 
RS 

<SQL- Statements> 


该 语法 中 各 参数 的 意义 与 CREATE PROCEDURE 语句 中 参数 的 意义 基本 相同 ,不 
再 著述 。 


2. 删除 存储 过 程 

使 用 DROP PROCEDURE 语句 同样 可 以 完成 存储 过 程 的 删除 。 其 语法 格式 如 下 。 
DROP PROCEDURE <procedureName> 

【 例 13. 29】 删除 存储 过 程 proStuByNo。 


DROP PROCEDURE ProStuBYNo 


13.6 触发 器 


13.6.1 触发 器 概述 


触发 器 (Trigger) 是 用 户 定义 在 关系 表 上 的 一 类 由 事件 驱动 的 存储 过 程 ,由 服务 器 自 
动 激活 。 触 发 器 可 进行 更 为 复杂 的 检查 和 操作 ,具有 更 精细 和 更 强大 的 数据 控制 能 力 。 
触发 器 是 一 种 特殊 的 存储 过 程 , 它 包括 大 量 的 Transact-SQL 语句 。 但 是 触发 器 又 与 一 
般 的 存储 过 程 有 着 显著 的 区 别 ,一 般 的 存储 过 程 可 以 由 用 户 直接 调用 执行 ,但 是 触发 器 不 
能 被 直接 调用 执行 , 它 依 存 于 表 的 数据 库 对 象 , 只 能 由 事件 触发 而 自动 执行 ,例如 当 对 一 
个 表 进 行 操 作 ( 如 INSERT UPDATE 或 DELETE 等 操作 ) 时 就 可 能 会 触发 它 执行 ,无 
须 客户 调用 。 

触发 器 具有 以 下 几 个 特点 。 

(1) 触发 器 是 自动 执行 的 , 当 用 户 对 表 中 数据 做 了 某 些 操 作 之 后 立即 被 触发 。 

(2) 触发 器 可 通过 数据 库 中 的 相关 表 实 现 级 联 更 改 , 实 现 多 个 表 之 间 数 据 的 一 致 性 
和 完整 性 。 

(3) 触发 器 可 以 强制 比 用 CHECK 约束 定义 的 约束 更 为 复杂 的 约束 。 与 CHECK 约 
束 不 同 ,触发 器 可 以 引用 其 他 表 中 的 列 。 

(4) 触发 器 也 可 以 评估 数据 修改 前 后 的 表 状 态 ,并 根据 其 差异 采取 对 策 。 
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13.6.2 创建 触发 器 


触发 器 自身 根据 依存 的 表 的 操作 类 型 分 为 INSERT、UPDATE 和 DELETE 三 种 。 
创建 触发 器 的 语法 如 下 。 

CREATE TRIGGER <triggerName> 

ON <tableName> 

FOR { INSERT | UPDATE | DELETE } 

AS <SQL- Statement> 

其 中 ， 

(1) 一 triggerName 二 : 触发 器 的 名 称 ,在 数据 库 中 必须 唯一 。 

(2) 过 tableName>: 触发 器 作用 的 基本 表 , 该 表 也 称 为 触发 器 的 目标 表 。 

(3) { INSERT | UPDATE | DELETE }: 触发 器 事件 ,触发 器 的 事件 可 以 是 插入 
INSERT 更 新 UPDATE 和 删除 DELETE 事件 ,也 可 以 是 这 几 个 事件 的 组 合 。 

(4) INSERT 类 型 的 触发 器 : 是 指 当 对 指定 表 二 tableName 执 行 了 插入 操作 时 系 
统 自动 执行 触发 器 代码 。 

(5) UPDATE 类 型 的 触发 器 : 是 指 当 对 指定 表 二 tableName 二 执行 了 更 新 操作 时 系 
统 自动 执行 触发 器 代码 。 

(6) DELETE 类 型 的 触发 器 : 是 指 当 对 指定 表 二 tableName 过 执行 了 删除 操作 时 系 
统 自动 执行 触发 器 代码 。 

(7) 二 SQL-Statement 二 : 触发 动作 的 执行 体 , 即 一 段 SQL 语句 块 ,如 果 该 触发 执行 
体 执行 失败 , 则 激活 触发 器 的 事件 就 会 终止 , 且 触 发 器 的 目标 表 二 tableName 二 或 触发 器 
可 能 影响 的 其 他 表 不 发 生 任何 变化 , 即 执行 事务 的 回 深 操 作 。 

【 例 13.30】 当 插 入 一 学 生 记录 时 ,提示 信息 “插入 了 一 条 学 生 记 录 ”。 

CREATE TRIGGER tg print student insert 

ON Student 

FOR INSERT 

AS 

Print ' 插 入 了 一 条 学 生 记录 ' 


可 以 触发 该 触发 器 的 INSERT 语句 如 下 。 
INSERT INTO Student values ('201825016', ' 李 娜 ' null,null,null,null,null) 


触发 器 执行 结果 如 图 13.2 所 示 。 
插入 了 一 条 学 生 记录 
(所 影响 的 行 数 为 1 行 ) 
图 13.2 触发 器 tg_print_student_insert 的 执行 结果 


本 例 中 INSERT 和 触发 器 的 工作 过 程 如 下 。 
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(1) 在 定义 了 INSERT 触发 器 的 学 生 信 息 表 上 执行 INSERT 语句 。 

(2) INSERT 语句 插入 的 记录 被 记录 下 来 。 

(3) 触发 器 操作 被 执行 。 

【 例 13.31】 创建 名 为 tg_course_update 的 UPDATE 触发 器 ,防止 用 户 修改 课程 信 
息 表 中 的 “课程 名 称 ” 列 。 


CREATE TRIGGER tg _course update 
ON Course 
FOR UPDATE 
RS 
IF UPDATE (cname) 
BEGIN 
RAISERROR(' 不 能 修改 课程 名 称 ', 16, 10) 
ROLLBACK TRANSACTION 
END 


可 以 触发 该 触发 器 的 UPDATE 语句 如 下 。 


UPDATE Course SET cname= ' 数 据 结构 与 数据 库 ' WHERE cno='006" 
触发 器 执行 结果 如 图 13. 3 所 示 。 


50000， 级 别 16， 状 态 10， 过 程 tg_course_update, 行 7 


图 13.3 触发 器 tg_course_update 的 执行 结果 


回 滚 事 务 ROLLBACK 语句 , 即 撤销 表 的 修改 操作 ,执行 此 语句 时 所 做 的 操作 为 : 由 
修改 语句 对 基础 表 执行 的 所 有 工作 都 被 撤销 。 若 该 语句 在 撤销 表 的 修改 操作 时 给 出 错误 
消息 , 则 可 在 执行 ROLLBACK 语句 时 ,使 用 PRINT 语句 显示 提示 信息 ,或 使 用 
RAISERROR 语句 返回 错误 消息 。 

此 外 ,触发 器 常用 于 保证 完整 性 ,并 在 一 定 程度 上 实现 安全 性 ,如 可 以 用 触发 器 来 进 
行 审计 。 

【 例 13.32】 创建 触发 器 ,只 有 数据 库 拥有 者 才 可 以 修改 成 绩 表 中 的 成 绩 ,其 他 用 户 
对 成 绩 表 的 插入 、 删 除 和 修改 操作 必须 记录 下 来 。 

记录 用 户 的 操作 轨迹 ,首先 创建 一 张 表 , 表 结构 如 下 。 


CREATE TABLE TableOperation ( 


userid char (10) NOT NULL, -- 用 户 标识 
operateDate datetime NOT NULL, -操作 时 间 
operateType char (10) NOT NULL, -操作 类 型 :插入 /删除 /更 新 


CONSTRAINT tableOperationPK PRIMARY KEY (userid, operateDate) 
) 


分 别 建立 三 个 触发 器 ,将 用 户 的 操作 轨迹 插入 到 审计 表 TableOperation 中 。 
/x* 插 入 触发 器 */ 
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CREATE TRIGGER ScoreOperationIns 


ON Score 
FOR INSERT 
RS 

INSERT INTO TableOperation VALUES (user, getdate(), 'insert') 
/* 删除 触发 器 * / 
CREATE TRIGGER ScoreOperationDel ON Score 
FOR DELETE 
RS 

INSERT INTO TableOperation VALUES (user, getdate () 'delete') 
/* 更 新 触发 器 * / 
CREATE TRIGGER ScoreOperationUpt ON Score 
FOR UPDATE 
RS 

IF EXISTS ( SELECT * FROM deleted ) 

BEGIN 

IF user!= 'dbo' -- 如 果 当 前 用 户 不 是 dbo, 则 不 允许 修改 
ROLLBRCK 
ELSE 
INSERT INTO TableOperation VALUES (user, getdate(), 'update') 
END 


注意 : 原则 上 并 不 限制 一 张 表 上 定义 的 触发 器 的 数量 ,但 是 由 于 触发 器 是 自动 执行 
的 ,如 果 为 一 张 表 建 立 了 多 个 触发 器 ,必然 加 大 系统 的 开销 。 所 以 如 果 和 触发 器 设计 得 不 
好 ,会 带 来 不 可 预知 的 后 果 。 触 发 器 常常 用 于 维护 复杂 的 完整 性 约束 ,不 用 于 业务 处 理 。 
凡是 可 以 用 一 般 约束 限制 的 ,就 不 要 使 用 触发 器 。 如 限制 性 别 仅 取 “ 男 ”" 和 “ 女 ”, 可 以 使 用 
检查 约束 CHECK 实现 。 


13.6.3 删除 和 修改 触发 器 

常用 的 触发 器 管理 主要 包括 修改 触发 器 和 删除 触发 器 管理 。 以 上 两 个 操作 与 创建 触 
发 器 的 基本 方法 大 体 相同 ,因此 本 节 只 介绍 其 语法 。 

1. 修改 触发 器 

使 用 ALTER TRIGGER 语句 修改 触发 器 的 语法 格式 如 下 。 


ALTER TRIGGER <triggerName> 
ON <tableName> 

FOR {INSERT | UPDATE | DELETE} 
RS <SQL- Statement> 


2. 删除 触发 器 
触发 器 不 需要 时 可 以 删除 ,使 用 DROP TRIGGER 语句 删除 触发 器 的 语法 格式 
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如 下 。 
DROP TRIGGER <triggerName> 
【 例 13.33】 删除 触发 器 tg_course_update。 


DROP TRIGGER tg course update 


小 结 


本 章 在 标准 SQL 的 基础 上 进行 了 Transact-SQL 的 功能 扩充 ,主要 介绍 数据 库 的 完 
整 性 约束 安全 性 约束 以 及 相应 的 数据 库 编 程 技术 ,编写 出 更 复杂 的 语句 ,如 游标 .存储 过 
程 和 触发 器 等 ,从 而 加 强 数 据 的 安全 性 、 完 整 性 约束 和 业务 规则 等 。 

(1) 数据 库 的 安全 性 : 保护 数据 库 以 防止 不 合法 使 用 所 造成 的 数据 泄密 、 更 改 或 
破坏 。 

(2) 数据 库 用 户 和 角色 的 权限 管理 方法 。 

(3) 数据 库 的 完整 性 : 防止 数据 库 中 存在 不 符合 语义 的 数据 ,其 防范 对 象 是 不 合 语 
义 的 .不 正确 的 数据 。 

(4) Transact-SQL 语句 中 的 变量 、 数 据 类 型 .函数 、 批 处 理 和 流程 控制 语句 。 

(5) 游标 的 概述 及 使 用 游标 的 5 个 步骤 : 定义 游标 DECLARE; 打 开 游 标 OPEN ; 逐 
行 提取 游标 集中 的 行 FETCH ;关闭 游标 CLOSE ;释放 游标 DEALLOCATE。 

(6) 存储 过 程 的 基本 概念 和 特点 ,如何 创 建 , 执 行 .管理 存储 过 程 。 

(7) 触发 器 的 概念 和 特点 ,如 何 创建 和 管理 触发 器 。 


习题 


13.1 实体 完整 性 和 参照 完整 性 的 作用 和 创建 方式 是 什么 ? 
13.2 流程 控制 语句 包括 哪些 ? 各 自 的 作用 是 什么 ? 

13.3 存储 过 程 主要 有 哪些 优点 ? 

13.4 和 触发 器 和 存储 过 程 的 相同 点 和 不 同 点 各 是 什么 ? 
13.5 触发 器 的 作用 是 什么 ? 


259 


~ 
完 | 


款 
3 


性 


第 14 章 事务 管理 与 恢复 


本 章 学 习 目标 
。 掌握 事务 的 概念 及 其 特征 。 
。 理解 数据 库 的 并 发 控制 。 
。 掌握 数据 库 的 备份 和 还 原 方法 。 


数据 库 作为 一 种 提供 共享 数据 服务 的 机 构 ,在 支持 用 户 并 发 访问 数据 的 同时 ,必须 保 
证 数据 访问 的 正确 性 和 可 靠 性 。 在 某 些 现实 应 用 中 需要 把 一 些 操作 作为 一 个 整体 ,或 者 
都 做 ,或 者 都 不 做 。 本 章 介绍 利用 事务 解决 此 类 问题 的 方法 ,介绍 事务 的 基本 概念 和 事务 
的 特性 ,深入 分 析 和 讨论 保证 事务 并 发 执行 的 隔离 性 、 原 子 性 和 永久 性 的 方法 与 策略 ,以 
及 数据 库 的 备份 和 恢复 技术 。 


14.1 事务 


14.1.1 并 发 操作 时 产生 的 问题 


前 面 讨 论 的 数据 库 操 作 都 没有 考虑 不 同 操作 之 间 的 内 在 联系 。 而 在 现实 应 用 中 , 数 
据 库 的 操作 与 操作 之 间 往 往 具 有 一 定 的 语义 和 关联 性 。 数 据 库 应 用 希望 将 这 些 有 关联 的 
操作 当 作 一 个 逻辑 工作 单元 看 待 ,要么 都 执行 ,要 么 都 不 执行 。 下 面 先 看 一 个 例子 。 

【 例 14.1】 假设 航班 的 剩余 票数 为 30 张 ,有 两 个 订 票 点 都 可 以 出 售 飞机 票 ,分 别 记 
为 Ti 和 Ts。 如 果 是 串 行 执行 , 则 不 管 是 Ti 先 执行 再 执行 T: ,还 是 Ts 先 执行 再 执行 
Ti ,都 可 得 到 正确 的 执行 结果 ,如 图 14. 1 所 示 。 

Select insert updata Select 


读 剩 余 票数 A， 订 三 张 机 票 ,将 剩余 票数 写 回 数据 库 ， 再 读 剩余 标 


select insert updata select 


图 14.1 可 串 行 调度 


在 并 发 操作 时 它们 的 执行 序列 如 图 14. 2 一 图 14.4 所 示 , 可 能 产生 丢失 更 新 问题 、 不 
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一 致 分 析 问 题 和 未 提交 依赖 问题 。 
丢失 更 新 问题 : 在 图 14. 2 中 ,Ti 和 T; 都 读 到 余 票数 为 30, 由 于 全 , 后 于 


Ti 提交 , 导 
致 T 的 更 新 操作 没有 发 生 作 用 ,被 Ts 的 更 新 值 覆盖 。 
订 票 点 读 剩余 票数 A， 订 三 张 机 票 ， 将 剩余 票数 写 回 数据 库 ， 再 读 剩余 票数 
1 
€ 一 | 机 票数 据 库 
(30 张 ) 
订 票 点 
2 读 剩 余 票数 A， 订 两 张 机 票 ， 将 剩余 票数 写 回 数据 库 ， 再 读 剩余 票数 
5 读 剩余 票 订 三 张 机 票 。 将 27 写 回 读 剩 余 
” 数 A=30 30-3=27 数据 库 票数 1 
读 剩余 票 ” 订 两 张 机 票 将 28 写 回 读 剩余 
数 A=30 30-2=28 数据 库 票数 


图 14.2 并 发 操作 时 产生 的 丢失 更 新 问题 


不 一 致 分 析 问题 : 在 图 14. 3 中 ,第 一 次 读 剩余 票数 为 30 张 ,第 二 次 读 时 为 27 张 ,两 
次 读 结果 不 一 致 。 


订 标 点 读 剩余 票数 A， 订 三 张 机 票 ， 将 剩余 票数 写 回 数据 库 ， 再 读 剩余 票数 
€ 机 票数 据 库 
(30 张 ) 
订 票 点 
订 票 点 法 利 余 标 数 A 
该 利 余 标 订 三 张 机 票 ”将 27 写 回 读 剩余 
林村 数 A=30 30-3=27 数据 库 票数 27 1 
读 剩余 票 
数 A=30 
订 票 点 
是 


图 14.3 并 发 操作 时 产生 的 不 一 致 分 析 问 题 


未 提交 依赖 问题 : 在 图 14.4 中 ,Ti 在 T: 读 取 其 更 新 值 后 回 滚 ,而 T; 仍然 使 用 读 到 
Ti 修改 后 的 值 进行 运算 ,得 到 的 结果 是 27。 但 实际 上 Ti 未 执行 成 功 ,剩余 票数 应 为 30。 

综 上 所 述 ,并 发 操作 可 能 出 现 以 下 问题 : 

(1) 丢失 更 新 问题 。 两 个 或 多 个 T 都 读 取 了 同一 数据 值 并 修改 ,最 后 提交 的 执行 结 
果 覆 盖 了 前 面 提交 的 执行 结果 ,从 而 导致 前 面 的 更 新 丢失 。 
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读 剩 余 票 数 A ， 订 三 张 机 票 ， 将 剩余 票数 写 回 数据 库 ， 取 消 订 票 写 库 


订 票 点 
下 
© 机 票数 据 库 
(30 张 ) 
fe 
订 票 点 。 流利 全票 教 A 
订 票 点 读 剩余 票 订 三 张 机 票 ”将 27 写 回 取消 订 票 
了 数 A=30 30-3=27 数据 库 写 库 1 

读 剩余 票 
数 A=27 


订 票 点 


图 14.4 并 发 操作 时 产生 的 未 提交 依赖 问题 


(2) 不 一 致 分 析 问 题 。 是 指 T; 两 次 从 数据 库 中 读 取 的 结果 不 同 ,T; 读 取 一 数据 后 ， 
T; 对 该 数据 进行 了 更 改 。 当 T; 再 次 读 该 数据 时 , 则 会 读 到 与 前 一 次 不 同 的 值 。 

(3) 未 提交 依赖 问题 。 如 果 Ts 读 取 Ti 修改 但 未 提交 的 数据 后 ,Ti 由 于 某 种 原因 中 
止 而 撤销 ,这 时 T, 就 读 取 了 不 一 致 的 数据 。 数 据 库 中 将 这 种 读 未 提交 且 被 撤销 的 数据 
为 读 “ 脏 数据 ”。 

为 解决 上 述 问题 ,数据库 管理 系统 引入 了 事务 的 概念 , 它 将 这 些 有 内 在 联系 的 操作 当 
作 一 个 逻辑 单元 看 待 ,并 采取 相应 策略 保证 一 个 逻辑 单元 内 的 全 部 操作 要 么 都 执行 成 功 ， 
要 么 都 不 执行 。 对 数据 库 用 户 而 言 ,只 需 将 具有 完整 逻辑 意义 的 一 组 操作 正确 地 定义 在 
一 个 事务 之 内 即 可 。 


14.1.2 事务 的 概念 


对 于 用 户 而 言 ,事务 是 具有 完整 逻辑 意义 的 数据 库 操作 序列 的 集合 。 对 于 数据 库 管 
理 系 统 而 言 , 事 务 则 是 一 个 读 写 操作 序列 。 这 些 操 作 是 一 个 不 可 分 割 的 逻辑 工作 单元 ,要 
么 都 做 ,要 么 都 不 做 。 

事务 是 数据 库 管 理 系统 中 竞争 资源 .并 发 控制 和 恢复 的 基本 单元 。 它 是 由 数据 库 操 
作 语 言 (如 SQL) 或 高 级 编程 语言 (如 Java、C、C++ ) 提 供 的 事务 开始 语句 .事务 结束 语句 
以 及 由 它们 包含 的 全 部 数据 库 操作 语 名 组成。 通常 有 以 下 两 种 类 型 的 事务 结束 语句 。 

(1) 事务 提交 (Commit) : 将 成 功 完成 事务 的 执行 结果 ( 即 更 新 ) 永 久 化 ,并 释放 事务 
占有 的 全 部 资源 。 

(2) 事务 回 滚 (Rollback) : 中 止 当前 事务 .撤销 其 对 数据 库 所 做 的 更 新 ,并 释放 事务 
占有 的 全 部 资源 。 

SQL Server 数据 库 提 供 了 三 种 类 型 的 事务 模式 : 显 式 事务 、 隐 式 事务 及 自 定义 
事务 ， 
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(1) 显 式 事务 是 指 用 户 使 用 Transact-SQL 事务 语句 所 定义 的 事务 ,其 事务 语句 包括 
以 下 三 种 。 

@ 事务 开始 : BEGIN TRANSACTION。 

@ 事务 提交 : COMMIT TRANSACTION,COMMIT WORK。 

@ 事务 回 滚 : ROLLBACK TRANSACTION,ROLLBACK WORK。 

(2) 隐 式 事务 是 指 事务 提交 或 回 滚 后 ,系统 自动 开始 新 的 事务 。 该 类 事务 不 需要 采 
用 BEGIN TRANSACTION 语句 标识 事务 的 开始 。 

(3) 自动 定义 事务 : 当 一 个 语句 成 功 执行 后 , 它 被 自动 提交 ,而 当 执 行 过 程 中 出 错 
时 , 则 被 自动 回 深 。 


14.1.3 事务 的 特性 


为 了 保证 事务 并 发 执行 或 发 生 故 障 时 数据 库 的 一 致 性 (完整 性 ), 事 务 应 具有 以 下 
特性 。 

(1) 原子 性 (Atomicity)。 事 务 的 所 有 操作 要 么 全 部 都 被 执行 ,要 么 都 不 被 执行 。 

一 个 事务 是 一 个 不 可 分 割 的 工作 单位 ,事务 中 包括 的 诸 操 作 要 么 都 做 ,要 人 么 都 不 做 ， 
这 就 是 事务 的 原子 性 。 这 里 的 原子 性 也 称 为 故障 原子 性 或 (故障 ) 可 靠 性 ,由 DBMS 通过 
撤销 未 完成 事务 对 数据 库 的 影响 来 实现 。 保 持 事务 的 原子 性 是 DBMS 事务 管理 子 系统 
的 职责 。 

(2) 一 致 性 (Consistency)。 一 个 单独 执行 的 事务 应 保证 其 执行 结果 的 一 致 性 , 即 总 
是 将 数据 库 从 一 个 一 致 性 状态 转换 到 另 一 个 一 致 性 状态 。 

一 致 性 是 指 单个 事务 的 一 致 性 ,也 称 为 并 发 原子 性 或 正确 性 ,由 编写 该 事务 代码 的 应 
用 程序 员 负责 ,但 有 时 也 可 利用 DBMS 提供 的 数据 库 完 整 性 约束 (如 触发 器 ) 的 自动 检查 
功能 来 保证 。 

事务 的 一 致 性 包括 显 式 一 致 性 和 隐 式 一 致 性 。 显 式 一 致 性 是 显 式 定义 的 完整 性 约 
东 , 如 主 码 , 外 码 ,用 户 自 定义 约 东 等 。 隐 式 一 致 性 是 业务 规则 隐 含 的 完整 性 要 求 。 如 机 
票 售 出 后 ,一 航班 已 售 出 票数 和 剩余 票数 之 和 应 等 于 该 航班 全 部 座位 数 ;转账 完成 后 A 
账户 和 B 账户 的 存款 余额 总 数 不 变 等 。 

(3) 隔离 性 (Isolation) 。 当 多 个 事务 并 发 执行 时 ,一 个 事务 的 执行 不 能 影响 另 一 个 事 
务 , 即 并 发 执行 的 各 个 事务 不 能 互相 干扰 。 

多 个 事务 并 发 执行 的 结果 与 分 别 执行 单个 事务 的 结果 是 完全 一 样 的 ,这 就 是 事务 的 
隔离 性 。 隔 离 性 也 称 为 执行 原子 性 或 可 串 行 化 ,可 以 看 作 是 多 个 事务 并 发 执行 时 的 一 致 
性 或 正确 性 要 求 。 事 务 的 隔离 性 是 由 DBMS 的 并 发 控制 子 系统 保证 的 。 

(4) 持久 性 (Durability) 。 一 个 事务 成 功 提交 后 , 它 对 数据 库 的 改变 必须 是 永久 的 ， 
即使 随后 系统 出 现 故障 也 不 会 受到 影响 。 

持久 性 也 称 为 恢复 原子 性 或 恢复 可 靠 性 , 它 是 利用 已 记录 在 稳固 存储 介质 (如 磁盘 阵 
列 ) 中 的 恢复 信息 (如 日 志 、 备 份 等 ) 来 实现 丢失 数据 (如 因 中 断 而 丢失 的 存放 在 主 存 中 但 
还 未 保存 到 磁盘 数据 库 中 去 的 数据 等 ) 的 恢复 。 持 久 性 要 求 事务 对 数据 库 的 更 新 在 其 结 
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束 前 已 写 人 磁盘 ,或 在 数据 库 更 新 时 记录 足够 多 的 信息 ,使 得 在 出 现 故 障 时 DBMS 能 利 
用 这 些 信息 重 构 数据 库 的 更 新 。 它 是 由 DBMS 的 恢复 管理 模块 保证 的 。 

由 于 允许 CPU 和 I/O 操作 并 行 执行 ,操作 系统 采用 了 多 道 程序 设计 技术 , 即 允 许多 
个 程序 并 发 执行 ,可 提高 CPU 和 设备 的 利用 率 。 同 样 ,数据库 管理 系统 也 允许 多 个 事务 
并 发 执行 ,其 主要 优点 体现 在 以 下 两 个 方面 。 

(1) 增加 系统 吞吐 量 (Throughput) 。 吞 吐 量 是 指 单位 时 间 系 统 完成 事务 的 数量 。 当 
一 个 事务 需 等 待 磁盘 I/O 时 ,CPU 可 去 处 理 其 他 正在 等 待 CPU 的 事务 。 这 样 , 可 减少 
CPU 和 磁盘 空闲 时 间 ,增加 给 定时 间 内 完成 事务 的 数量 。 

(2) 减少 平均 响应 时 间 (Average Response Time)。 事 务 响应 时 间 是 指 事务 从 提交 
给 系统 到 最 后 完成 所 需要 的 时 间 。 事 务 的 执行 时 间 有 长 有 短 , 如 果 按 事务 到 达 的 顺序 依 
次 执行 , 则 短 事务 就 可 能 会 由 于 等 待 长 事务 导致 完成 时 间 的 延长 。 如 果 允 许 并 发 执行 , 短 
事务 可 以 较 早 地 完成 。 因 此 ,并 发 执行 可 减少 事务 的 平均 响应 时 间 。 

事务 的 并 发 执行 可 提高 系统 性 能 ,缺点 是 若 不 对 事务 的 并 发 执行 加 以 控制 , 则 可 能 破 
坏 数 据 库 的 一 致 性 。 


14.2 并 发 控制 


当 数 据 库 中 多 个 事务 并 发 执行 时 ,事务 的 隔离 性 不 总 是 能 得 以 保证 ,DBMS 必须 采 
取 一 定 的 措施 对 并 发 执行 事务 之 间 的 相互 影响 加 以 控制 ,这 种 措施 就 是 并 发 控制 机 制 。 

并 发 控制 机 制 大 体 上 可 分 为 翡 观 的 和 乐观 的 两 种 。 翡 观 的 并 发 控制 方法 认为 数据 库 
的 一 致 性 经 常会 受到 破坏 ,因此 在 事务 访问 数据 对 象 前 须 采取 一 定 措施 加 以 控制 ,只 有 得 
到 访问 许可 时 ,才能 访问 数据 对 象 ,如 基于 封锁 的 并 发 控制 方法 。 乐 观 的 并 发 控制 方法 则 
认为 数据 库 的 一 致 性 通常 不 会 遭 到 破坏 ,故事 务 执行 时 可 直接 访问 数据 对 象 ,只 在 事务 结 
东 时 才 验 证 数据 库 的 一 致 性 是 否 会 遭 到 破坏 ,如 基于 有 效 性 验证 方法 。 本 章 主要 介绍 前 
者 ,基于 封锁 的 并 发 控制 方法 。 

基于 封锁 的 并 发 控制 方法 的 基本 思想 是 : 当 事 务 了 需 访 问 数据 对 象 Q 时 , 先 申请 对 
Q 的 锁 。 如 获得 批准 , 则 事务 了 继续 执行 , 且 此 后 不 允许 其 他 任何 事务 修改 Q, 直 到 事务 
工 释 放 Q 上 的 锁 为 止 。 给 数据 项 加 锁 的 方式 有 多 种 ,这 里 介绍 基本 锁 类 型 。 

(1) 共享 锁 (shared lock, 记 为 S) : 如 果 事 务 了 获得 了 数据 对 象 Q 的 共享 锁 , 则 事务 
工 可 读 Q 但 不 能 写 Q。 

(2) 排他 锁 (eXclusive lock, 记 为 X): 如 果 事务 工 获 得 了 数据 对 象 Q 上 的 排他 锁 ， 
则 事务 工 既 可 读 Q 又 可 写 Q。 

封锁 方法 要 求 每 个 事务 都 要 根据 自己 对 数据 对 象 的 操作 类 型 ( 读 操作 、 写 操作 或 读 写 
操作 ) 向 事务 管理 器 申请 适度 的 锁 : 读 操 作 申请 S 锁 , 写 操作 或 读 写 操作 申请 X 锁 。 事 务 
管理 器 收 到 封锁 请 求 后 , 按 封 锁 相 容 性 原则 判断 是 否 能 满足 该 事务 的 加 锁 请 求 。 事 务 只 
有 得 到 授予 的 锁 后 ,才能 继续 其 操作 ,否则 等 待 。 

“ 锁 相 容 ” 是 指 如 果 T; 已 持 有 数据 对 象 Q 的 某 类 型 锁 后 ,事务 T; 也 申请 对 Q 的 封 
锁 。 如 果 人 允许 事务 T; 获得 对 Q 的 锁 , 则 称 事务 T; 申请 锁 类 型 与 事务 了; 的 持 有 锁 类 型 


264 


事务 管理 与 恢复 


相 容 ;否则 称 为 不 相 容 。 基 本 锁 类 型 的 封锁 相 容 性 原则 为 : 共享 锁 与 共享 锁 相 容 ,而 排他 
锁 与 共享 锁 、 排 他 锁 与 排他 锁 是 不 相 容 的 。 

设 事务 可 通过 下 列 操作 申请 和 释放 锁 。 

(1) SLCQ) 一 一 申请 数据 对 象 Q 上 的 共享 锁 。 

(2) XL(Q) 一 一 申请 数据 对 象 Q 上 的 排他 锁 。 

(3) UL(Q) 一 一 释放 数据 对 象 Q 上 的 锁 。 

封锁 是 防止 存 取 同一 资源 的 用 户 之 间 破 坏 性 的 干扰 的 机 制 , 该 干扰 是 指 不 正确 地 修 
改 数 据 或 不 正确 地 更 改 数 据 结构 。 事 务 在 对 某 个 数据 对 象 如 关系 、 元 组 等 进行 查询 或 更 
新 操作 以 前 ,应 先 向 系统 发 出 对 该 数据 对 象 进行 加 锁 的 请 求 ,否则 就 不 可 以 进行 相应 操 
作 ,而 事务 在 获得 了 对 该 数据 对 象 的 锁 以 后 ,其 他 的 事务 就 不 能 查询 或 更 新 此 数据 对 象 ， 
直到 相应 的 锁 被 释放 为 止 。 封 锁 协 议 保证 了 并 发 执行 事务 结果 的 正确 性 ,但 仍然 存在 两 
个 主要 的 问题 : 死 锁 和 活 锁 。 

(1) 死 锁 : 在 多 个 事务 并 发 执行 的 过 程 中 ,还 会 出 现 另 外 一 种 称 为 死 锁 的 现象 , 即 多 
个 并 发 事务 处 于 相互 等 待 的 状态 。 其 中 的 每 一 个 事务 都 在 等 竺 它们 中 的 另 一 个 事务 释放 
封锁 ,这 样 才 可 以 继续 执行 下 去 ,但 任何 一 个 事务 都 没有 释放 自己 已 获得 的 锁 ,也 无 法 获 
得 其 他 事务 已 拥有 的 锁 ,所 以 只 好 相互 等 待 下 去 ,不 难 发 现 图 14. 5 中 发 生 了 死 锁 现象 。 
事务 T 和 事务 T, 分 别 在 同一 时 刻 锁 住 了 机 票数 据 对 象 和 客户 数据 对 象 ,而 后 事务 又 申 
请 对 男 一 数据 对 象 加 锁 , 而 这 两 个 数据 对 象 都 已 分 别 被 对 方 事 务 控制 且 没 有 释放 ,所 以 双 
方 事务 只 好 相互 等 待 。 这 样 ,双方 因为 得 不 到 自己 想 要 的 锁 , 所 以 无 法 继续 往 下 执行 。 同 
时 ,也 就 没有 机 会 释放 已 得 到 的 锁 , 所 以 对 方 事务 的 等 待 是 永久 性 的 ,这 就 是 死 锁 。 


将 利 余 票数 写 回 数据 库 ， 
D7 


封锁 


图 14.5 并 发 操作 时 产生 的 死 锁 问题 


(2) 活 锁 : 多 个 事务 并 发 执行 的 过 程 中 ,可 能 会 存在 某 个 有 机 会 获得 锁 的 事务 却 永 
远 也 没有 得 到 锁 ,这 种 现象 称 为 活 锁 。 采 用 ”* 先 来 先 服务 "的 策略 可 以 预防 活 锁 的 发 生 。 

死 锁 的 预防 : 数据 库 中 预防 死 锁 的 方法 有 两 种 。 第 一 种 方法 是 要 求 每 个 事务 必须 一 
次 性 地 将 所 有 要 使 用 的 数据 加 锁 ,或 必须 按照 一 个 预先 约定 的 加 锁 顺 序 对 使 用 到 的 数据 
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加 锁 。 第 二 种 方法 是 每 当 处 于 等 待 状态 的 事务 有 可 能 导致 死 锁 时 ,就 不 再 等 待 下 去 ,强行 
滚 该 事务 。 

死 锁 的 检测 : 定期 检查 是 否 有 死 锁 发 生 , 当 系统 存在 死 锁 时 ,一 定 要 解除 死 锁 。 具 体 
的 方法 是 从 发 生死 锁 的 事务 中 选择 一 个 回 滚 代价 最 小 的 事务 ,将 其 彻底 回 滚 ,或 回 滚 到 可 
以 解除 死 锁 处 ,释放 该 事务 所 持 有 的 锁 , 使 其 他 的 事务 可 以 获得 相应 的 锁 而 得 以 继续 运行 
下 去 ,从 而 解锁 。 


14.3 恢复 与 备份 


当 我 们 使 用 一 个 数据 库 时 ,总 希望 数据 库 的 内 容 是 可 靠 的 .正确 的 ,但 由 于 计算 机 系 
统 的 故障 (硬件 故障 ,软件 故障 、 网 络 故 障 、 进 程 故障 和 系统 故障 ) 会 影响 数据 库 系 统 的 操 
作 , 影 响 数据 库 中 数据 的 正确 性 ,其 至 破坏 数据 库 , 使 数据 库 中 全 部 或 部 分 数据 丢失 ,一 旦 
数据 出 现 丢 失 或 者 损坏 ,都 将 给 企业 和 个 人 带 来 巨大 的 损失 。 因 此 当 发 生 上 述 故 障 后 ,人 
们 和 希望 能 重新 建立 一 个 完整 的 数据 库 ,该 处 理 称 为 数据 库 恢 复 。 恢 复 子 系统 是 数据 库 管 
理 系 统 的 一 个 重要 组 成 部 分 ,恢复 处 理 随 所 发 生 的 故障 类 型 所 影响 的 结构 而 变化 。 本 节 
将 对 数据 库 的 备份 和 恢复 做 一 介绍 。 


瑟 


14.3.1 数据 库 系 统 的 故障 


数据 库 运 行 过 程 中 可 能 发 生 的 故障 可 分 为 以 下 几 类 。 
1. 事务 故障 


事务 在 运行 过 程 中 由 于 种 种 原因 ,如 输入 数据 的 错误 、 运 算 溢 出 、 违 反 了 某 些 完整 性 
限制 . 某 些 应 用 程序 的 错误 以 及 并 发 事务 发 生死 锁 等 ,使 事务 未 运行 至 正常 终止 点 就 天 折 
了 ,这 种 情况 称 为 事务 故障 。 该 类 故障 的 特征 是 系统 的 软件 和 硬件 都 能 正常 运行 ,内 存 和 
磁盘 上 的 数据 都 未 丢失 和 破坏 。 发 生 事务 故障 时 ,可 以 强行 回 滚 C(ROLLBACK) 天 折 事 
务 ,清除 其 对 数据 库 的 所 有 修改 ,使 得 该 事务 好 像 根 本 没有 启动 过 一 样 , 这 类 恢复 操作 称 
为 事务 撤销 (UNDO)。 


2. 系统 故障 


系统 故障 是 指 系 统 在 运行 过 程 中 ,由 于 某 种 原因 ,如 操作 系统 或 DBMS 代码 错误 、 操 
作 员 操作 失误 .特定 类 型 的 硬件 错误 (如 CPU 故障 ) 突然 停电 等 造成 系统 停止 运行 , 致 
使 所 有 正在 运行 的 事务 都 以 非 正常 方式 终止 。 该 类 故障 的 特征 是 数据 库 缓 冲 区 的 信息 全 
部 丢失 ,但 存储 在 外 部 存储 设备 上 的 数据 未 被 破坏 。 发 生 系统 故障 时 ,为 了 保证 数据 一 至 
性 ,需要 清除 这 些 事务 对 数据 库 的 所 有 修改 ,强行 UNDO 所 有 未 完成 事务 。 另 一 方面 , 恢 
复 程序 除 需 要 撤销 所 有 未 完成 事务 外 ,还 需要 重 做 (REDO) 所 有 已 提交 的 事务 ,以 便 将 数 
据 库 真正 恢复 到 某 个 一 致 状态 。 
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3. 介质 故障 


介质 故障 是 指 系 统 在 运行 过 程 中 ,由 于 某 种 硬件 故障 ,如 磁盘 损坏 、 磁 头 碰撞 ,或 操作 
系统 的 某 种 潜在 错误 、 瞬 时 强 磁场 干扰 等 ,致使 存储 在 外 存 中 的 数据 部 分 丢失 或 全 部 丢 
失 。 这 类 故障 比 前 两 类 故障 的 可 能 性 小 得 多 ,但 破坏 了 磁盘 上 的 数据 ,危害 性 最 大 。 事务 
故障 和 系统 故障 可 以 由 系统 自动 恢复 ,而 介质 故障 必须 借助 数据 库 管理 员 的 帮助 ,由 数据 
库 管理 员 和 系统 一 起 恢复 。 发 生 故 障 后 ,存储 在 磁盘 上 的 数据 被 破坏 ,这 时 需要 装 人 发 生 
介质 故障 前 某 个 时 刻 的 数据 库 数 据 副 本 ,并 重 做 (REDO) 自 备份 相应 副本 数据 库 之 后 的 
所 有 成 功 事务 ,将 这 些 事务 已 提交 的 更 新 结果 重新 反映 到 数据 库 中 去 。 


4. 其 他 故障 


随 着 网 络 技术 的 不 断 发 展 ,数据 库 面 临 的 恶意 破坏 现象 也 越 来 越 多 ,如 黑客 人 侵 、 病 
毒 、 恶 意 流氓 软件 等 引起 的 事务 异常 结束 、 算 改 数据 等 不 一 致 性 。 该 类 故障 主要 通过 数据 
库 的 安全 机 制 、 审 计 机 制 等 实现 对 数据 的 授权 访问 和 保护 。 

对 于 不 同类 型 的 故障 在 恢复 时 应 做 不 同 的 恢复 处 理 。 从 原理 上 讲 , 恢 复 的 本 质 是 利 
用 存储 的 元 余数 据 ( 如 日 志 、 影 子 、 备 份 副本 等 ) 来 重建 数据 库 中 已 经 被 破坏 或 已 经 不 正确 
的 那 部 分 数据 。DBMS 中 的 恢复 管理 模块 由 以 下 两 部 分 组 成 。 

(1) 正常 事务 处 理 过 程 中 : 系统 需 记 录 宛 余 的 恢复 信息 ,以 保证 故障 发 生 后 有 足够 
的 信息 进行 数据 库 恢 复 。 

(2) 故障 发 生 后 : 利用 元 余 信息 进行 UNDO 或 REDO 等 操作 ,将 数据 库 恢复 到 一 臻 


14.3.2 数据 库 备份 


数据 库 备 份 (Backup) 是 数据 库 管理 系统 用 来 进行 介质 故障 恢复 的 常用 方法 。 它 是 
由 DBA 周期 性 地 将 整个 数据 库 的 内 容 复制 到 其 他 外 存储 器 上 (通常 为 大 容量 的 磁带 或 
磁 鼓 ) 保 存 起 来 。 数 据 库 备 份 操作 可 分 为 静态 备份 和 动态 备份 。 静 态 备份 是 在 系统 中 无 
运行 事务 时 进行 的 备份 操作 ,优点 是 简单 ,但 由 于 备份 必须 等 待 用 户 事务 结束 后 才能 进 
行 ,而 新 的 事务 必须 等 待 备份 结束 后 才能 执行 ,因此 会 降低 数据 库 的 可 用 性 。 动 态 备 份 是 
指 备份 操作 与 用 户 事务 的 执行 并 发 进行 ,备份 期 间 人 允许 对 数据 库 进行 存 取 或 修改 。 动 态 
备份 克服 了 静态 备份 的 缺点 , 它 不 用 等 待 正在 运行 的 用 户 事务 结束 ,也 不 会 影响 新 事务 的 
运行 ,但 它 不 能 保证 副本 中 的 数据 正确 有 效 。 

按照 备份 数据 库 的 大 小 ,数据 库 备份 有 4 种 类 型 ,分别 应 用 于 不 同 的 场合 。 


1. 完全 数据 库 备份 (数据 库 备份 ) 


数据 库 备 份 是 指 对 数据 库 的 完整 备份 ,这 是 大 多 数 人 常用 的 方式 , 它 可 以 备份 整个 数 
据 库 , 包 含 用 户 表 、 系 统 表 、 索 引 、 视 图 和 存储 过 程 等 所 有 数据 库 对 象 . 数 据 和 事物 日 志 中 
的 事务 。 这 种 备份 方式 非常 简便 易 行 ,通常 按照 一 个 常规 的 时 间 间 隔 进行 ,但 它 需 要 花费 
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更 多 的 时 间 和 空间 ,所 以 ,一般 推荐 一 周 做 一 次 完全 备份 。 在 还 原 数据 库 时 ,只 需 用 简单 
的 操作 即 可 完成 数据 库 的 恢复 。 恢 复 后 的 数据 库 与 备份 完成 时 的 数据 库 状 态 一 致 。 这 种 
方式 应 该 与 下 面 的 其 他 几 种 备份 方式 相互 结合 ,才能 最 大 程度 地 对 数据 库 数据 进行 保护 。 


2. 差异 数据 库 备 份 ( 增 量 备份 ) 


差异 数据 库 备 份 是 指 将 最 近 一 次 完全 数据 库 备 份 以 来 发 生 的 数据 变化 备份 起 来 , 因 
此 差异 数据 库 备 份 实际 上 是 一 种 增 量 数据 库 备份 。 它 是 只 备份 数据 库 一 部 分 的 男 一 种 方 
法 , 它 不 使 用 事务 日 志 , 相 反 , 它 使 用 整个 数据 库 的 一 种 新 映像 。 它 比 最 初 的 完全 备份 小 ， 
因为 它 只 包含 自 上 次 完全 备份 以 来 所 改变 的 数据 库 。 对 于 一 个 经 常 进行 数据 操作 的 数据 
库 而 言 ,需要 在 完全 数据 库 备份 的 基础 上 ,进行 差异 备份 。 差 异 数据 库 备 份 比 完全 数据 库 
备份 需要 的 磁盘 空间 小 而 且 备份 速度 快 ,因此 可 以 更 经 常 地 备份 。 通 过 增加 差异 备份 的 
备份 次 数 ,可 以 减少 丢失 数据 的 危险 。 使 用 差异 数据 库 备份 只 能 将 数据 库 还 原 到 差异 数 
据 库 备份 完成 时 的 那 一 点 , 若 要 恢复 到 精确 的 故障 点 ,必须 使 用 事务 日 志 备份 。 


3. 事务 日 志 备份 


事务 日 志 备份 是 对 数据 库 发 生 的 事务 进行 备份 ,包括 从 上 次 事务 日 志 备份 .差异 备份 
和 完全 数据 库 备份 后 ,数据 库 已 经 执行 完成 的 所 有 事务 。 它 可 以 在 相应 的 数据 库 备份 的 
基础 上 ,将 数据 库 恢 复 到 特定 的 即时 点 或 恢复 到 故障 点 时 的 状态 。 由 于 事务 日 志 备 份 仅 
对 数据 库 事 务 日 志 进 行 备份 ,所 以 所 需 的 磁盘 空间 和 备份 时 间 都 比 完全 数据 库 备 份 (备份 
数据 和 日 志 ) 少 得 多 ,这 是 它 的 优点 所 在 。 正 是 基于 此 ,我 们 在 备份 时 常常 采用 这 样 的 策 
略 , 即 每 一 天 进行 一 次 完全 数据 库 备 份 ,而 以 一 个 小 时 或 几 个 小 时 的 频率 备份 事务 日 志 。 
这 样 利 用 事务 日 志 备份 ,可 以 将 数据 库 恢复 到 任意 一 个 创建 事务 日 志 备份 的 时 刻 。 

差异 备份 需要 的 时 间 和 事务 日 志 备份 需要 的 时 间 比 完全 数据 库 备 份 需 要 的 时 间 都 少 
得 多 ,但 它们 之 间 有 一 个 重要 的 差别 : 事务 日 志 备份 含有 自 上 次 备份 以 来 某 数据 变化 所 
包含 的 多 次 所 有 修改 , 它 记 录 操作 的 过 程 ;而 差异 备份 只 包含 该 行 的 最 后 一 次 修改 , 它 记 
录 动 作 的 结果 。 

4. 文件 或 文件 组 备份 

文件 或 文件 组 备份 指 对 数据 库 文件 或 文件 夹 进 行 备份 ,但 其 不 像 完 全 数据 库 备 份 屠 
样 同时 也 进行 事务 日 志 备份 。 使 用 该 方法 可 提高 数据 库 恢 复 的 速度 ,因为 仅 对 遭 到 破坏 
的 文件 或 文件 组 进行 恢复 。 

但 是 在 使 用 文件 或 文件 组 进行 恢复 时 , 仍 要 求 有 一 个 自 上 次 备份 以 来 的 事务 日 志 备 
份 来 保证 数据 库 的 一 致 性 ,所 以 在 进行 完 文件 或 文件 组 备份 后 应 再 进行 事务 日 志 备份 , 否 
则 备份 在 文件 或 文件 组 备份 中 的 所 有 数据 库 变化 将 无 效 。 


14.3.3 数据 库 恢 复 


数据 库 恢复 是 指数 据 库 系统 在 进行 的 某 事务 失败 后 重新 恢复 之 前 的 数据 的 操作 。 例 
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如 , 当 一 个 顾客 在 超市 购买 商品 ,在 出 口 结账 时 ,商品 信息 是 逐条 被 终端 扫描 并 记录 的 ,但 
是 ,整个 购买 行为 会 被 作为 一 个 事务 在 所 有 商品 信息 扫描 完毕 后 提交 给 数据 库 系 统 。 然 
后 ,系统 再 执行 该 事务 ,修改 数据 库 中 有 关 收 入 和 存货 清单 的 数据 表 。 如 果 数 据 库 突 然 发 
生 故 障 , 顾 客 的 购买 行为 没有 全 部 完成 ,如 果 不 对 数据 库 进 行 恢 复 操作 ,会 给 数据 库 系 统 
恢复 后 的 数据 维护 以 及 当前 的 客户 结账 造成 麻烦 。 因 为 已 经 把 该 客户 的 整个 购买 行为 定 
义 为 事务 ,所 以 这 时 就 只 需要 撤销 其 事务 即 可 。 

尽管 数据 库 系统 采取 很 多 措施 保证 事务 的 正确 执行 ,但 是 仍旧 无 法 保证 数据 库 中 数 
据 的 绝对 安全 ,故障 是 不 可 避免 的 。 故 障 一 旦 发 生 , 轻 则 造成 运行 事务 非 正 常 中 断 , 影 响 
数据 库 中 数据 的 一 致 性 , 重 则 破坏 数据 库 , 使 数据 库 中 的 数据 全 部 或 部 分 丢失 ,因此 数据 
库 管理 系统 必须 具有 数据 库 恢复 功能 。 

数据 库 恢 复 是 指 通过 技术 手段 ,将 保存 在 数据 库 中 丢失 的 电子 数据 进行 抢救 和 恢复 
的 技术 。 数 据 库 备 份 的 数据 文本 称 为 后 备 副本 或 后 援 副本 。 一 旦 系统 发 生 介 质 故障 , 数 
据 库 遭 到 破坏 ,可 以 将 后 备 副本 重新 装 人 ,再 利用 日 志 重 做 最 后 一 次 备份 之 后 所 提交 的 所 
有 事务 或 按 提 交 顺 序 重 新 运行 这 些 事 务 ,将 数据 库 恢复 到 故障 前 的 一 致 性 状态 ,如 
图 14.6 所 示 。 


运行 上 


按 日 志 重 新 执行 

苔 奉 各 在 | 。。 对 数据 库 的 操作 
数据 库 数据 库 人 还 原 
2 3 _| 备份 


图 14.6 数据 库 的 恢复 


数据 库 可 能 因为 硬件 或 软件 (或 两 者 同时 ) 的 故障 变 得 不 可 用 ,不 同 的 故障 情况 需要 
不 同 的 恢复 操作 。 我 们 必须 决定 最 适合 业务 环境 的 恢复 方法 。 恢 复数 据 库 有 三 种 类 型 或 
方法 , 即 应急 恢 复 ,版 本 恢复 和 前 滚 恢复 。 

(1) 应 急 恢复 : 应 急 恢复 用 于 防止 数据 库 处 于 不 一 致 或 不 可 用 状态 。 数 据 库 执行 的 
事务 (也 称 工作 单元 ) 可 能 被 意外 中 断 , 若 在 作为 工作 单位 一 部 分 的 所 有 更 改 完成 和 提交 
之 前 发 生 故 障 , 则 该 数据 库 就 会 处 于 不 一 致 和 不 可 用 的 状态 。 这 时 ,需要 将 该 数据 库 转换 
为 一 致 和 可 用 的 状态 。 为 此 ,需要 回 深 未 完成 的 事务 ,并 完成 当 发 生 崩 溃 时 仍 在 内 存 中 的 
已 提交 事务 。 如 在 COMMIT 语句 之 前 发 生 了 电源 故障 , 则 在 下 一 次 重新 启动 并 再 次 访 
问 该 数据 库 时 ,需要 回 滚 到 执行 COMMIT 语句 前 的 状态 。 回 滚 语句 的 顺序 与 最 初 执行 
时 的 顺序 相反 。 
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(2) 版 本 恢复 : 版 本 恢复 指 的 是 使 用 备份 操作 期 间 创 建 的 映像 来 复原 数据 库 的 先前 
版 本 。 这 种 恢复 是 通过 使 用 一 个 以 前 建立 的 数据 库 备份 恢复 出 一 个 完整 的 数据 库 。 一 个 
数据 库 的 备份 允许 把 数据 库 恢 复 至 和 这 个 数据 库 在 备份 时 完全 一 样 的 状态 。 而 从 备份 建 
立 后 到 日 志文 件 中 最 后 记录 的 所 有 工作 事务 单位 将 全 部 丢失 。 

(3) 前 滚 恢复 : 这 种 恢复 技术 是 版 本 恢复 的 一 个 扩展 ,使 用 完整 的 数据 库 备 份 和 日 
志 相 结合 ,可 以 使 一 个 数据 库 或 者 被 选择 的 表 空 间 恢复 到 某 个 特定 时 间 点 。 如 果 从 备份 
时 刻 起 到 发 生 故 障 时 的 所 有 日 志文 件 都 可 以 获得 的 话 , 则 可 以 恢复 到 日 志 上 涵盖 到 的 任 
意 时 间 点 。 前 滚 恢复 需要 在 配置 中 被 明确 激活 才能 生效 。 

数据 库 系 统 的 三 种 主要 故障 的 恢复 方法 如 下 。 

(1) 事务 故障 恢复 。 

当 事 务 发 生 故 障 时 ,恢复 子 系统 应 利用 日 志文 件 撤销 CUNDO) 此 事务 对 数据 库 进 行 
的 修改 。 事 务 故 障 的 恢复 通常 是 由 系统 自动 完成 ,用 户 并 不 知道 系统 是 如 何 进行 事务 恢 
复 的 。 

事务 故障 的 恢复 步骤 如 下 。 

Q@ 反 向 扫描 日 志文 件 ( 即 从 最 后 向 前 扫描 日 志文 件 ) ,查找 该 事务 的 更 新 操作 。 

@ 对 该 事务 的 更 新 操作 执行 逆 操 作 , 即 将 日 志 记 录 中 * 更 新 前 的 值 ? 写 人 数据 库 。 如 
果 记 录 中 是 插入 操作 , 则 相当 于 做 删除 操作 (因此 时 “更 新 前 的 值 ”为 空 ); 若 记录 中 是 删除 
操作 , 则 做 插入 操作 ;若是 修改 操作 , 则 相当 于 用 修改 前 的 值 代替 修改 后 的 值 。 

@ 重复 执行 D 和 @ ,恢复 该 事务 的 其 他 更 新 操作 ,直至 读 到 该 事务 的 开始 标记 ,事务 
故障 恢复 就 完成 了 。 

(2) 系统 故障 的 恢复 。 

恢复 操作 就 是 要 撤销 故障 发 生 时 未 完成 的 事务 , 重 做 已 完成 的 事务 。 系 统 故障 的 恢 
复 是 由 系统 在 重新 启动 时 自动 完成 的 ,不 需要 用 户 干预 。 系 统 故障 的 恢复 步骤 如 下 。 

@ 正 向 扫描 日 志文 件 ( 即 从 头 扫描 日 志文 件 ) ,指出 在 故障 发 生前 已 经 提交 的 事务 ， 
将 其 事务 标记 记 入 重 做 队列 。 同 时 找 出 故障 发 生 时 尚未 完成 的 事务 ,将 其 事务 标记 记 入 
撤销 队列 。 

@ 对 撤销 队列 中 的 各 个 事务 进行 撤销 (CUNDO) 处 理 。 进 行 撤销 处 理 的 方法 是 : 反 
向 扫描 日 志文 件 , 对 每 个 事务 的 更 新 操作 执行 逆 操 作 , 即 将 日 志 记 录 中 * 更 新 前 的 值 " 写 入 
数据 库 。 

@ 对 重 做 队列 中 的 各 个 事务 进行 重 做 (REDO) 处 理 。 进 行 重 做 处 理 的 方法 是 : 正 向 
扫描 日 志文 件 ,对 每 个 重 做 事务 重新 执行 日 志文 件 登 记 的 操作 ,即将 日 志 记录 中 “更 新 后 
的 值 ” 写 人 数据 库 。 

(3) 介质 故障 的 恢复 。 

介质 故障 会 破坏 磁盘 上 的 物理 数据 库 和 日 志文 件 , 这 是 最 严重 的 一 种 故障 。 恢 复方 
法 是 重 装 数据 库 后 备 副本 ,然后 重 做 已 完成 的 事务 。 

介质 故障 的 恢复 步骤 如 下 。 

@ 装 和 人 最 新 的 数据 库 后 备 副 本 ( 离 故障 发 生 时 刻 最 近 的 转 储 副 本 ) ,使 数据 库 恢 复 到 
最 近 一 次 转 储 时 的 一 致 性 状态 。 对 于 动态 转 储 的 数据 库 副本 ,还 需要 同时 装 和 人 转 储 开 始 
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时 刻 的 日 志文 件 副本 。 利 用 恢复 系统 故障 的 方法 ( 即 重 做 十 撤销 的 方法 ) 才 能 将 数据 库 恢 
复 到 一 致 性 状态 。 

@ 装 入 相应 的 日 志文 件 副本 ( 转 储 结束 时 刻 的 日 志文 件 副本 ), 重 做 已 完成 的 事务 ， 
即 首先 扫描 日 志文 件 , 找 出 故障 发 生 时 已 提交 的 事务 的 标识 ,将 其 记 入 重 做 队列 ,然后 正 
向 扫描 日 志文 件 , 对 重 做 队列 中 的 所 有 事务 进行 重 做 处 理 (将 日 志 记录 中 ”更 新 后 的 值 ? 写 
入 数据 库 ) 。 

随 着 磁盘 技术 的 发 展 (容量 大 、 价 格 低 ) ,恢复 技术 发 展 很 快 。 各 种 实际 DBMS 的 恢 
复 技术 还 是 不 尽 相同 的 ,在 实际 应 用 中 ,应 按照 实际 DBMS 的 要 求 来 完成 恢复 的 前 期 工 
作 和 恢复 工作 。 


小 结 


本 章 详 细 介 绍 了 事务 的 概念 与 特征 、 并 发 控制 和 数据 库 恢复 技术 。 
(1) 事务 是 数据 库 进 行 并 发 控制 的 基本 单位 ,多 个 事务 的 并 发 调度 会 带 来 一 些 问 题 。 
如 丢失 更 新 ,不 一 致 分 析 和 未 提交 依赖 问题 。 

(2) 事务 是 具有 完整 逻辑 意义 的 数据 库 操作 序列 的 集合 。 对 于 数据 库 管理 系统 而 
,事务 则 是 一 个 读 写 操作 序列 。 这 些 操 作 是 一 个 不 可 分 割 的 逻辑 工作 单元 ,要 么 都 做 ， 
要 么 都 不 做 。 

(3) 解决 并 发 问题 的 方法 是 封锁 ,封锁 可 分 为 排他 锁 和 共享 锁 。 在 利用 封锁 进行 并 
发 控制 时 必须 遵守 一 定 的 封锁 协议 。 另 外 ,在 封锁 的 过 程 中 ,还 会 发 生活 锁 和 死 锁 现 象 。 

(4) 数据 库 系统 在 运行 过 程 中 会 遇 到 各 种 障碍 ,常见 的 故障 类 型 有 事务 故障 、 系 统 故 
障 、 介 质 故 障 和 其 他 故障 。 

(5) 数据 库 备 份 可 以 有 4 种 类 型 : 完全 数据 库 备份 (数据 库 备份 )、 差 异 数据 库 备 份 
( 增 量 备份 ) ,事务 日 志 备 份 和 文件 或 文件 组 备份 ,分 别 应 用 于 不 同 的 场合 。 

(6) 数据 库 恢复 是 指 通 过 技术 手段 ,将 保存 在 数据 库 中 丢失 的 电子 数据 进行 抢救 和 
恢复 的 技术 。 


节 


习题 


14.1 试 述 事务 的 定义 和 特征 。 

14.2 事务 并 发 执行 可 能 带 来 哪些 问题 ? 试 举例 说 明 。 
14.3 ”什么 是 活 锁 和 死 锁 ? 如 何 预防 和 解除 ? 

14.4” 试 述 数 据 库 系 统 的 故障 类 型 。 
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本 章 学 习 目 标 
。 了 解 C 井 语言 常用 的 数据 库 连接 方法 。 
。 掌握 使 用 C# 语 言 和 SQL Server 2000 开发 数据 库 应 用 程序 的 方法 。 


一 个 完整 的 数据 库 应 用 系统 应 包括 用 户 界面 .业务 逻辑 和 数据 库 访 问 。SQL Server 
不 具有 图 形 用 户 界面 的 设计 功能 ,因此 一 般 把 它 作为 数据 库 应 用 系统 的 后 端 数 据 库 ,而 图 
形 用 户 界面 的 设计 可 使 用 可 视 化 的 开发 工具 来 完成 。 本 章 将 以 Visual Studio 2008 为 开 
发 环境 ,使 用 C# 语 言 作 为 开发 工具 ,以 酒店 客房 管理 系统 为 例 ,介绍 数据 库 应 用 系统 的 
开发 方法 。 


15.1 ADO.NET 概述 


ADO. NET(ActiveX Data Objects. NET) 是 Microsoft 公司 提供 的 程序 访问 数据 库 
系统 的 API, 它 是 一 组 向 . NET 程序 员 公 开 数 据 访问 服务 的 类 。ADO. NET 模型 是 
Microsoft 公司 新 一 代 的 数据 库 访 问 模 型 ,通过 它 可 以 进行 数据 库 的 连接 与 访问 。 通 过 
ADO. NET ,程序 员 可 以 很 轻易 地 使 用 各 种 对 象 ( 控 件 ) 来 访问 符合 自己 要 求 的 数据 库 内 
容 。ADO. NET 是 应 用 程序 和 数据 源 之 间 的 桥梁 。 通 过 ADO. NET 所 提供 的 对 象 ,再 配 
合 SQL 语句 ,可 以 访问 很 多 数据 库 中 的 数据 ,如 dBase、Excel、Access、SQL Server 和 
Oracle。Visual Studio 2008 通过 提供 数据 访问 技术 ADO. NET 来 实现 对 数据 库 访 问 的 
支持 。 

ADO. NET 为 创建 分 布 式 数据 共享 应 用 程序 提供 了 一 组 丰富 的 组 件 , 它 可 以 对 关系 
数据 .XML 和 应 用 程序 数据 进行 访问 ,是 . NET Framework 中 不 可 缺少 的 一 部 分 。 
ADO. NET 支持 多 种 开发 需求 ,包括 创建 由 应 用 程序 .工具 .语言 或 Internet 浏览 器 使 用 
的 前 端 数 据 库 客户 端 和 中 间 层 业务 对 象 。 

ADO. NET 定义 了 两 个 核心 组 件 : . NET Framework 数据 提供 程序 和 DataSet, 其 结 
构 如 图 15.1 所 示 。 

DataSet 组 件 设计 的 目的 是 为 了 实现 独立 于 任何 数据 源 的 数据 访问 , 它 可 以 用 于 多 
种 不 同 的 数据 源 和 XML 数据 。DataSet 数据 集 是 ADO. NET 离线 数据 访问 模型 中 的 核 
心 对 象 ,主要 作用 是 在 内 存 中 暂 存 并 处 理 各 种 从 数据 源 中 所 取 回 的 数据 。 

.NET Framework 数据 提供 程序 是 ADO. NET 中 的 一 个 核心 元 素 , 其 组 件 的 设计 目 
的 是 为 了 实现 数据 处 理 和 对 数据 的 快速 ,只 进 、 只 读 访问 。. NET Framework 数据 提供 程 
序 由 Connection、Command、DataReader 和 DataAdapter 4 个 核心 对 象 组 成 。Connection 
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SQL Server .NET Framework 数据 提供 程序 


Connection DataAdapter 


SelectCommand DataSet 


Command InsertCommand | 一 | | DataTableCollection 


UpdataCommand DataRelationCollection 


DataReader 


DeleteCommand 


Co SQL Server 数据 库 


图 15.1 ADO .NET 结构 


对 象 用 于 提供 与 数据 源 的 连接 。Command 对 象 用 于 对 数据 源 执行 命令 ,使 用 户 能 够 访问 
用 于 返回 数据 、 修 改 数据 、 运 行 存储 过 程 以 及 发 送 或 检索 参数 信息 的 数据 库 命令 。 
DataReader 对 象 用 于 从 数据 源 中 提供 高 性 能 的 数据 流 。DataAdapter 对 象 是 提供 连接 


DataSet 对 


象 和 数据 源 的 桥梁 , 它 使 用 Command 对 象 在 数据 源 中 执行 SQL 命令 ,以 便 将 


数据 加 载 到 DataSet 中 ,并 使 对 DataSet 中 数据 的 更 改 与 数据 源 保持 一 致 。 
ADO 提供 类 和 对 象 以 完成 以 下 活动 。 
(1) 连接 到 数据 源 (Connection) ,并 可 选择 开始 一 个 事务 ; 
(2) 可 选择 创建 对 象 来 表示 SQL 命令 (Command); 
(3) 可 选择 在 SQL 命令 中 指定 列 、 表 和 值 作为 变量 参数 (Parameter); 
(4) 执行 命令 (Command、Connection 或 Recordset); 
(5) 如 果 命 令 按 行 返回 , 则 将 行 存储 在 缓存 中 (Recordset); 
(6) 可 选择 创建 缓存 视图 ,以 便 能 对 数据 进行 排序 筛选 和 定位 (Recordset) ; 
(7) 通过 添加 、 删 除 或 更 改行 和 列 编辑 数据 (Recordset); 
(8) 在 适当 情况 下 ,使 用 缓存 中 的 更 改 内 容 来 更 新 数据 源 (Recordset) ; 
(9) 如 果 使 用 了 事务 , 则 可 以 接受 或 拒绝 在 完成 事务 期 间 所 做 的 更 改 并 结束 事务 


(CConnection ) 。 


表 15. 


对 象 


1 给 出 了 ADO 对 象 模型 中 的 对 象 及 其 说 明 。 
表 15.1 ADO 对 象 模型 中 的 对 象 及 其 说 明 
说 明 


Connection | 代表 打开 的 ,与 数据 源 的 连接 
Command Command 对 象 定义 了 将 对 数据 源 执行 的 指定 命令 
Parameter | 代表 与 基于 参数 化 查询 或 存储 过 程 的 Command 对 象 相关 联 的 参数 或 自 变量 
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续 表 
对 象 说 明 
二 Eee 代表 来 自 基本 表 或 命令 执行 结果 的 记录 的 全 集 。 任 何 时 候 ,Recordset 对 象 所 指 的 当前 
记录 均 为 集合 内 的 单个 记录 
Field 代表 使 用 普通 数据 类 型 的 数据 的 列 
Error 包含 与 单个 操作 (涉及 提供 者 ) 有 关 的 数据 访问 错误 的 详细 信息 
Property 代表 由 提供 者 定义 的 ADO 对 象 的 动态 特性 
表 15.1 中 ， 
Connection 对 象 : Connection 对 象 代表 打开 的 ,与 数据 源 的 连接 。 使 用 Connection 
对 象 可 执行 下 列 操作 。 
(1) 在 打开 连接 前 使 用 ConnectionString、ConnectionTimeout 和 Mode 属性 对 连接 
进行 配置 。 


(2) 设置 CursorLocation 属性 以 便 调用 支持 批 更 新 的 “客户 端 游 标 提供 者 ”。 

(3) 使 用 DefaultDatabase 属性 设置 连接 的 默认 数据 库 。 

(4) 使 用 IsolationLevel 属性 为 在 连接 上 打开 的 事务 设置 隔离 级 别 。 

(5) 使 用 Provider 属性 指定 OLE DB 提供 者 。 

(6) 使 用 Open 方法 建立 到 数据 源 的 物理 连接 ,使 用 Close 方法 将 其 断 开 。 

(7) 使 用 Execute 方法 执行 连接 的 命令 ,并 使 用 CommandTimeout 属性 对 执行 进行 
配置 。 

(8) 使 用 BeginTrans、CommitTrans 和 RollbackTrans 方法 以 及 Attributes 属性 管 
理 打开 的 连接 上 的 事务 (如 果 提 供 者 支持 则 包括 嵌 套 的 事务 )。 

(9) 使 用 Errors 集合 检查 数据 源 返 回 的 错误 。 

(10) 通过 Version 属性 读 取 使 用 中 的 ADO 执行 版 本 。 

(11) 使 用 OpenSchema 方法 获取 数据 库 模式 信息 。 

Command 对 象 ，Command 对 象 定义 了 将 对 数据 源 执行 的 指定 命令 。 使 用 
Command 对 象 可 进行 下 列 操作 。 

(1) 使 用 CommandText 属性 定义 命令 (如 SQL 语句 ) 的 可 执行 文本 。 

(2) 通过 Parameter 对 象 和 Parameters 集合 定义 参数 化 查询 或 存储 过 程 参数 。 

(3) 使 用 Execute 方法 执行 命令 并 在 适当 的 时 候 返 回 Recordset 对 象 。 

(4) 执行 前 应 使 用 CommandType 属性 指定 命令 类 型 以 优化 性 能 。 

(5) 使 用 Prepared 属性 决定 提供 者 是 否 在 执行 前 保存 准备 好 (或 编译 好 ) 的 命令 
版 本 。 

(6) 使 用 CommandTimeout 属性 设置 提供 者 等 待命 令 执 行 的 秒 数 。 

(7) 通过 设置 ActiveConnection 属性 使 打开 的 连接 与 Command 对 象 关联 。 

(8) 设置 Name 属性 将 Command 标识 为 与 Connection 对 象 关联 的 方法 。 

(9) 将 Command 对 象 传 送 给 Recordset 的 Source 属性 以 便 获 取 数 据 。 

Parameter 对 象 : Parameter 对 象 代 表 与 基于 参数 化 查询 或 存储 过 程 的 Command 对 
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象 相 关联 的 参数 或 自 变量 。 使 用 Parameter 对 象 可 进行 如 下 操作 。 

(1) 使 用 Name 属性 可 设置 或 返回 参数 名 称 。 

(2) 使 用 Value 属性 可 设置 或 返回 参数 值 。 

(3) 使 用 Attributes 和 Direction、Precision、NumericScale、Size 以 及 Type 属性 可 设 
置 或 返回 参数 特性 。 

(4) 使 用 AppendChunk 方法 可 将 长 整 型 二 进 制 或 字符 数据 传递 给 参数 。 

Recordset 对 象 : Recordset 对 象 表示 来 自 基 本 表 或 命令 执行 结果 的 记录 集合 。 任 何 
时 候 , Recordset 对 象 所 指 的 当前 记录 均 为 集合 内 的 单个 记录 。 使 用 ADO 时 ,通过 
Recordset 对 象 可 对 几乎 所 有 数据 进行 操作 。 所 有 Recordset 对 象 均 使 用 记录 ( 行 ) 和 字 
段 ( 列 ) 进 行 构造 。 

(1) 可 以 创建 所 需 数量 的 Recordset 对 象 。 打 开 Recordset 时 ,当前 记录 位 于 第 一 个 
记录 (如 果 有 ) ,并且 BOF 和 EOF 属性 被 设置 为 False。 如 果 没 有 记录 ,BOF 和 EOF 属 
性 设置 是 True。 

(2) 可 以 使 用 MoveFirst、MoveLast、MoveNext、MovePrevious 和 Move 方法 ,以 及 
AbsolutePosition、AbsolutePage 和 Filter 属性 来 重新 确定 当前 记录 的 位 置 。 

(3) Recordset 对 象 可 支持 两 类 更 新 : 使 用 立即 更 新 ,一 旦 调用 Update 方法 ,对 数据 
的 所 有 更 改 将 被 立即 写 入 基本 数据 源 ; 也 可 以 使 用 AddNew 和 Update 方法 将 值 的 数组 
作为 参数 传递 ,同时 更 新 记录 的 若干 字段 。 

(4) 如 果 提 供 者 支持 批 更 新 ,可 以 使 提供 者 将 多 个 记录 的 更 改 存 人 缓存 ,然后 使 用 
UpdateBatch 方法 在 单个 调用 中 将 它们 传送 给 数据 库 。 

Field 对 象 : Field 对 象 代表 使 用 普通 数据 类 型 的 数据 的 列 。 使 用 Field 对 象 可 进行 
如 下 操作 。 

(1) 使 用 Name 属性 可 返回 字段 名 。 

(2) 使 用 Value 属性 可 查看 或 更 改 字段 中 的 数据 。 

(3) 使 用 Type、Precision 和 NumericScale 属性 可 返回 字段 的 基本 特性 。 

(4) 使 用 DefinedSize 属性 可 返回 已 声明 的 字段 大 小 。 

(5) 使 用 ActualSize 属性 可 返回 给 定 字段 中 数据 的 实际 大 小 。 

(6) 使 用 Attributes 属性 和 Properties 集合 可 决定 对 于 给 定 字 段 哪些 类 型 的 功能 受 
到 支持 。 

(7) 使 用 AppendChunk 和 GetChunk 方法 可 处 理 包 含 长 二 进 制 或 长 字符 数据 的 字 
段 值 。 

(8) 如 果 提 供 者 支持 批 更 新 ,可 使 用 OriginalValue 和 UnderlyingValue 属性 在 批 更 
新 期 间 解决 字段 值 之 间 的 差异 。 

Error 对 象 : Error 对 象 包 含 与 单个 操作 有 关 的 数据 访问 错误 的 详细 信息 。 通 过 
Error 对 象 可 获得 每 个 错误 的 详细 信息 ,包括 : 

(1) Description 属性 ,包含 错误 的 文本 。 

(2) Number 属性 ,包含 错误 常量 的 长 整 型 整数 值 。 
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(3) Source 属性 ,标识 产生 错误 的 对 象 。 在 向 数据 源 发 出 请 求 之 后 ,如 果 Errors 集 
合 中 有 多 个 Error 对 象 , 则 将 会 用 到 该 属性 。 

(4) SQLState 和 NativeError 属性 ,提供 来 自 SQL 数据 源 的 信息 。 

Property 对 象 : Property 对 象 代表 由 提供 者 定义 的 ADO 对 象 的 动态 特征 。ADO 对 
象 有 两 种 类 型 的 属性 : 内 置 属性 和 动态 属性 。 

(1) 内 置 属 性 是 在 ADO 中 实现 并 立即 可 用 于 任何 新 对 象 的 属性 ,此 时 使 用 
MyObject. Property 语法 。 它 们 不 会 作为 Property 对 象 出 现在 对 象 的 Properties 集合 
中 ,因此 ,虽然 可 以 更 改 它 们 的 值 , 但 无 法 更 改 它们 的 特性 。 

(2) 动态 属性 由 基本 的 数据 提供 者 定义 ,并 出 现在 相应 的 ADO 对 象 的 Properties 集 
合 中 。 
ADO. NET 其 实 就 是 . NET 框架 中 用 来 访问 和 操作 数据 源 的 框架 ,其 内 的 核心 类 库 
是 System. Data. dll( 我 们 常用 的 DataTable 与 DataSet 就 是 位 于 其 内 的 System. Data 命 
名 空间 内 ) ,ADO. NET 数据 库 访问 一 般 流程 如 下 。 

(1) 建立 Connection 对 象 ,创建 一 个 数据 库 连 接 。 

(2) 在 建立 连接 的 基础 上 可 以 使 用 Command 对 象 对 数据 库 发 送 查 询 、 新 增 、 修 改 和 
删除 等 命令 。 

(3) 创建 DataAdapter 对 象 ,从 数据 库 中 取得 数据 。 

(4) 创建 DataSet 对 象 ,将 DataAdapter 对 象 填充 到 DataSet 对 象 中 。 

(5) 如 果 需 要 可 以 重复 操作 ,一 个 DataSet 对 象 中 可 以 容纳 多 个 数据 集合 。 

(6) 关闭 数据 库 。 


15.2 系统 分 析 


15.2.1 系统 需求 分 析 


需求 分 析 阶 段 是 酒店 客房 管理 系统 开发 最 重要 的 阶段 。 开 发 者 必须 要 搞 清楚 用 户 的 
需求 ,以 确定 酒店 客房 管理 系统 的 功能 。 

该 酒店 客房 管理 系统 的 主要 任务 是 对 酒店 的 客房 进行 管理 ,使 用 户 能 轻松 地 找到 所 
需要 的 客房 信息 ,提供 入 住 和 退 房 服务 ,并 对 酒店 客房 的 业务 进行 记录 , 它 的 主要 功能 包 
括 以 下 几 个 方面 。 

(1) 用 户 信息 管理 : 实现 对 酒店 客房 管理 系统 的 使 用 人 员 进 行 管理 ,包括 对 使 用 人 
员 的 信息 (如 用 户 名 、 密 码 .用户 类 型 ) 进 行 增加 、 删 除 、 修 改 和 检索 。 

(2) 客房 类 型 管理 : 实现 对 酒店 客房 类 型 进行 管理 ,包括 对 客房 类 型 的 信息 (如 类 型 
编号 ,类 型 名 称 、 床 位 、 价 格 等 ) 进 行 增加 、 删 除 , 修 改 和 检索 。 

(3) 客房 信息 管理 : 实现 对 酒店 客房 信息 进行 管理 ,包括 对 客房 的 信息 (如 客房 号 、 
客房 类 型 .客房 位 置 等 ) 进 行 增加 、 删 除 、 修 改 和 检索 。 


276 


数据 库 应 用 开发 


(4) 客户 信息 查询 : 实现 对 入 住 过 酒店 的 客户 信息 (如 身份 证 号 、 姓 名 、 电 话 等 ) 进 行 
查询 。 

(5) 客房 信息 查询 : 实现 对 酒店 客房 的 信息 (如 客房 号 ,客房 类 型 .客房 位 置 ,客房 状 
态 等 ) 进 行 查 询 。 

(6) 客房 经 营 管理 : 实现 对 客房 的 入 住 和 退 房管 理 , 包 括 对 客房 的 业务 信息 (如 客房 
号 .人 房 时 间 、 退 房 时 间 、 金 额 等 ) 进 行 检索 .录入 和 修改 。 

(7) 业务 记录 查询 : 实现 对 酒店 历史 入 住 信息 (如 入 住 时 间 、 退 房 时 间 、 入 住人 员 身 
份 证 号 ,姓名 ,金额 等 ) 的 查询 。 

该 系统 的 功能 模块 图 如 图 15. 2 所 示 。 


酒店 客房 管理 系统 


用 户 客房 客房 客户 客房 客房 
信 加 息 类 型 信息 信息 信息 经 营 
管理 管理 管理 查询 查询 管理 


图 15.2 酒店 客房 管理 系统 功能 模块 图 


可 以 根据 不 同 酒店 的 具体 情况 ,对 上 述 功能 进行 修改 和 补充 。 
15.2.2 系统 用 例 分 析 


系统 的 用 例 分 析 用 来 确定 系统 中 各 用 例 与 用 户 角色 之 间 的 关系 。 本 例 的 用 例 图 如 


3 


用 户 信息 管理 客房 类 型 管理 客房 信息 管理 。 客房 经 营 管理 


业务 记录 查询 客户 信息 查询 客房 信息 查询 个 人 密码 修改 
图 15.3 酒店 客房 管理 系统 用 例 图 
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15.2.3 系统 时 序 图 


时 序 图 显示 了 一 个 具体 用 例 或 用 例 一 部 分 的 一 个 详细 流程 ,该 图 不 仅 可 以 显示 流程 
中 不 同 对 象 之 间 的 调用 关系 ,还 可 以 详细 显示 对 不 同 对 象 的 不 同调 用 。 下 面 给 出 入 住 和 
退 房 的 时 序 图 ,以 帮助 后 面 的 设计 工作 。 入 住 时 序 图 如 图 15.4 所 示 。 


系统 主 界面 | | 客房 信息 查询 界面 入 住 登记 界面 录入 客户 和 客房 信息 


1 T 


登录 


查询 


T 
' 
图 15.4 入 住 时 序 图 


退 房 时 序 图 如 图 15. 5 所 示 。 


用 户 
系统 主 界面 | | 客房 信息 查询 界面 结账 界面 录入 客房 使 用 信息 
上 
1 
1 


和 客房 未 入住 


查询 


-一 一 


客房 人 住 


确认 


T 
1 
! 
图 15.5 退 房 时 序 图 
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15.3 ”数据 库 分 析 和 设计 


15.3.1 数据 库 分 析 


数据 库 分 析 是 整个 数据 库 应 用 系统 开发 过 程 中 的 一 个 重要 环节 ,实体 模型 就 是 我 
们 通常 所 说 E-R 模型 , 它 是 设计 数据 库 的 基础 。 我 们 使 用 E-R 模型 对 酒店 管理 系统 的 
数据 进行 抽象 加 工 , 将 实体 集合 抽象 成 实体 类 型 ,用 实体 间 关 系 反映 本 系统 实体 间 的 
内 在 联系 。 由 于 篇 幅 有 限 ,这 里 直接 给 出 酒店 客房 管理 系统 的 ER 图 ,如 图 15. 6 
所 示 。 


EY 


身份 证 号 


类 型 编 名 称 价格 床位 


图 15.6 酒店 客房 管理 系统 E-R 图 


15.3.2 数据 库 设 计 


数据 库 分 析 完 成 后 ,就 可 以 对 数据 库 进行 设计 了 。 在 酒店 客房 管理 系统 中 ,数据 库 的 
设计 工作 主要 包括 建立 管理 系统 的 数据 库 , 创 建 所 需要 的 表 , 也 可 以 设计 相关 的 视图 及 存 
储 过 程 。 


1. 创建 数据 库 


数据 库 设 计 的 第 一 步 是 要 创建 一 个 数据 库 。 本 系统 使 用 的 数据 库 名 为 HotelRoomDB， 
启动 SQL Server 数据 库 , 新 建 数 据 库 。 


2. 创建 表 
根据 前 面 的 数据 库 分 析 ,可 以 确定 数据 库 HotelRoomDB 包含 以 下 5 个 表 : 用 户 信息 


279| 一 一 一 一 一 一 一 一 


数据 结构 与 数据 库 应 用 教程 


表 , 客 户 信 息 表 , 客 房 类 型 表 , 客 房 信息 表 , 客 房 业 务 表 。 


(1) 用 户 信息 表 。“ 用 户 信息 表 ”主要 用 来 保存 使 用 该 系统 的 用 户 的 基本 信息 ,其 定 
义 如 表 15. 2 所 示 。 
表 15.2 用 户 信 息 表 User 
字段 名 称 数据 类 型 是 否 为 空 约 束 
用 户 名 varchar(12) 否 主键 
密码 varchar(12) 否 
类 型 char(6) 否 


备注 : 类 型 分 为 酒店 管理 员 和 前 台 服务 人 员 。 
(2) 客户 信息 表 。“ 客 户 信 息 表 ” 主 要 用 来 保存 使 用 该 系统 的 客户 的 基本 信息 ,其 定 


义 如 表 15. 3 所 示 。 


表 15.3 客户 信息 表 Customer 


字段 名 称 数据 类 型 是 否 为 空 约 束 
身份 证 号 varchar(18) 否 主键 
姓名 varchar(12) 否 

电话 varchar(15) 否 


(3) 客房 类 型 表 。“ 客 房 类 型 表 ” 主 要 用 来 保存 使 用 该 系统 的 客房 类 型 的 基本 信息 ， 


其 定义 如 表 15.4 所 示 。 


表 15.4 客房 类 型 表 RoomType 


字段 名 称 数据 类 型 是 否 为 空 约 。 柬 
类 型 编号 char(4) 否 主键 
名 称 varchar(10) 否 唯一 
面积 float 是 

床位 int 是 

价格 smallmoney 否 

空调 bit 是 

电视 bit 是 

卫生 间 bit 是 


备注 : 空调 ,卫生间 洗浴 (0- 没 有 ,1- 有 )。 
(4) 客房 信息 表 。“ 客 房 信息 表 ” 主 要 用 来 保存 使 用 该 系统 的 客房 的 基本 信息 ,其 定 


义 如 表 15.5 所 示 。 
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表 15.5 客房 信息 表 Room 


字段 名 称 数据 类 型 是 否 为 空 约 束 
客房 号 char(6) 否 主键 
类 型 编号 char(4) 否 外 键 
位 置 varchar(20) 是 

描述 varchar(50) 是 

状态 bit 否 


备注 : 状态 (0- 空 房 ,1- 人 住 ) 。 


(5) 客房 业务 表 。“ 客 房 业务 表 ” 用 来 保存 酒店 客房 的 入住 的 业务 信息 ,其 定义 如 
表 15.6 所 示 。 


表 15.6 客房 业务 表 Check 


字段 名 称 数据 类 型 是 否 为 空 约 束 
客房 号 char(6) 否 外 键 
身份 证 号 varchar(18) 否 外 键 
和 人 住 时 间 datetime 否 
退 房 时 间 datetime 否 
金额 smallmoney 否 
备注 varchar(50) 是 
客房 号 和 身份 证 号 联合 作为 主键 


创建 完 * 用 户 信息 表 " 之 后 ,可 在 该 表 中 创建 一 个 用 户 类 型 为 酒店 管理 员 的 用 户 , 这 样 
可 在 运行 系统 时 通过 该 用 户 进行 登录 ,使 用 系统 所 有 功能 。 


15.4 数据 库 的 连接 和 访问 


15.4.1 数据 库 的 连接 


Connection 对 象 负责 建立 和 控制 用 户 应 用 程序 和 数据 库 之 间 的 连接 。 所 有 的 数据 
库 连 接 都 要 用 到 连接 字符 串 ,该 字符 串 是 使 用 分 号 隔 开 的 多 项 信息 ,其 内 容 随 着 数据 库 类 
型 和 访问 内 容 的 变化 而 变化 。 

连接 字符 串 的 格式 如 下 。 

"Server= 服 务 器 名 或 服务 器 IP 地 址 ;DataBase= 数 据 库 名 称 ;User ID= 用 户 名 ;Pwd= 密 码 " 

使 用 Connection 对 象 连 接 SQL Server 数据 库 的 方法 如 下 。 


using System.Data.sqlCclient; 引 用 namespace 
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SqlConnection con=new SqlConnection (连接 字符 串 ); 


con.Open (); 
// 数 据 库 相 关 操 作 
con.Close() 7 


1. 在 Web. config 文件 中 配置 与 数据 库 连 接 的 字符 串 


<configuration> 
<connectionstrings> 
<add name=" 连 接 字符 串 名 称 " connectionstring="Data Source= 服 务 器 名 或 服务 器 IP 
地 址 ; 

Initial Catalog= 数 据 库 名 称 ; Persist Security Info=True; User ID= 用 户 名 ; 
Password= 密 码 " 

providerName="System.Data.SsqlClient"/> 

<add name="Connectionstring" connectionstring="Server=127.0.0.1; 

database = HotelRoomDB; uid = sa; pwd = 123456" providerName =" System. Data. 
sqlclient"/> 

</connectionstrings> 


</configuration> 


2. 在 C# 中 获取 Web. config 文件 中 的 数据 库 连 接 字符 串 


连接 字符 串 =CconfigurationManager.ConnectionStrings [" 连 接 字符 串 名 称 "] .Tostring 
0) 


15.4.2 数据 库 的 访问 


法 : 


当 应 用 程序 与 数据 库 建 立 好 连接 后 , 便 可 从 数据 库 的 表 中 读 取 数 据 了 ,通常 有 两 种 方 


一 种 是 使 用 Command 和 DataReader 对 象 , 另 一 种 是 使 用 DataAdapter 和 DataSet 对 象 。 


1. 使 用 Command 和 DataReader 对 象 读 取 数 据 
DataReader 对 从 SQL 数据 库 检 索 的 数据 提供 仅 向 前 的 只 读 指针 。 由 于 DataReader 


类 是 抽象 类 ,不 能 直接 实例 化 ,因此 ,如 果 要 使 用 DataReader 对 象 ,需要 先 创 建 Command 
对 象 。Command 对 象 的 ExecuteReader 方法 将 创建 一 个 DataReader 对 象 ,该 对 象 从 数 
据 库 中 读 取 由 select 命令 返回 的 只 读 、 只 进 的 数据 流 , 且 一 次 只 读 取 一 条 数据 。 
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{ 

// 循 环 体内 语句 ,例如 :string s=dr["column name"] .ToString()7 
} 

dr.Close(); 


采取 这 种 方式 读 取 数据 时 ,内 存 中 只 有 一 行内 容 , 所 以 不 仅 提高 了 应 用 程序 的 性 能 ， 
还 有 助 于 减少 系统 的 开销 。 采 用 DataReader 对 象 读 取 数 据 的 方式 适用 于 下 列 情形 。 

(1) 不 需要 缓存 数据 ; 

(2) 要 处 理 的 结果 太 大 ,内 存 中 放 不 下 ; 

(3) 需要 以 仅 向 前 、 只 读 方式 快速 访问 数据 。 

DataReader 读 取 数据 的 过 程 如 下 。 

(1) 创建 连接 ; 

(2) 打开 连接 ; 

(3) 创建 Command 对 象 ; 

(4) 执行 Command 的 ExecuteReader() 方 法 ; 

(5) 将 DataReader 绑 定 到 数据 控件 中 ; 

(6) 关闭 DataReader; 

(7) 关闭 连接 。 

DataReader 对 象 的 局 限 性 有 以 下 三 点 。 

(1) 只 能 向 前 循环 读 取 数 据 ; 

(2) 只 能 读 取 数据 ,不 能 修改 数据 ， 

(3) 只 能 处 理 一 个 表 的 数据 。 

注意 : DataReader 在 使 用 时 ,将 以 独占 方式 使 用 Connection。 也 就 是 说 ,在 用 
DataReader 读 取 数据 时 ,与 DataReader 对 象 关 联 的 Connection 对 象 不 能 再 为 其 他 对 象 
所 使 用 。 因 此 ,在 使 用 完 DataReader 后 ,应 显 式 调用 DataReader 的 Close() 方 法 断 开 和 
Connection 的 关联 。 


2. 使 用 DataAdapter 和 DataSet 对 象 读 取 数据 


DataAdapter 是 DataSet 与 数据 库 之 间 的 沟通 媒介 ,DataAdapter 打开 一 个 连接 并 执 
行 指定 的 SQL 命令 ,将 获取 的 数据 填充 到 DataSet。 也 可 以 将 DataSet 中 的 数据 更 新 到 
数据 源 中 。DataAdapter 对 象 常用 方法 有 : Fill() 从 数据 源 获取 数据 填充 DataSet; 
@Update() 将 DataSet 中 的 数据 更 新 到 数据 源 。 

DataSet 是 数据 在 内 存 中 的 缓存 ,相当 于 在 内 存 中 的 一 个 小 型 关系 数据 库 , 与 数据 源 
是 断 开 的 。DataSet 的 结构 和 关系 型 数据 库 很 类 似 , 具 有 表 . 行 、 列 等 属性 。 它 主要 用 于 
在 内 存 中 存放 数据 ,可 以 一 次 读 取 整 张 数 据 表 的 内 容 。 

DataSet 对 象 可 以 存放 DataAdapter 对 象 执行 SQL 命令 后 所 取得 的 数据 。DataSet 
也 是 一 个 集合 对 象 ,一 个 DataSet 对 象 包括 一 组 DataTable 对 象 和 DataRelation 对 象 ,应 
用 程序 可 以 通过 DataTable 对 象 和 DataTable 对 象 内 的 DataColumn 对 和 象 .DataRow 对 
象 的 操作 读 取 数 据 。 
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SqlDataAdapter da=new SqlDataAdapter (cmdstr, con); 
// 使 用 指定 的 SQL 命令 和 连接 对 象 创建 SqlDataAdapter 对 象 
DataSet ds=new DataSet (); // 创 建 DataSet 对 象 
da.Fill(ds, "table name"); // 使 用 sqlDataAdapter 的 Fill 方法 填充 Dataset, 并 创建 一 
// 个 名 为 *table_name” 的 DataTable 对 象 ,将 数据 存放 其 中 


DataSet 读 取 数据 的 过 程 如 下 。 

(1) 创建 连接 ; 

(2) 创建 DataAdapter 对 象 ; 

(3) 创建 DataSet 对 象 ; 

(4) 执行 DataAdapter 对 象 的 Fill() 方 法 ; 

(5) 将 DataSet 中 的 表 绑 定 到 数据 控件 中 。 

DataAdapter 的 Fill 方法 会 自动 检查 数据 库 连 接 是 否 打开 ,如 果 没 有 打开 , 则 先 自动 


调用 Open() 方 法 打开 连接 ,再 执行 填充 操作 ,在 数据 填充 结束 后 ,会 自动 调用 Close( ) 方 
法 关闭 数据 库 连 接 。 因 此 无 须 在 代码 中 添加 Open() 和 Close() 方 法 。 


使 用 Command 对 象 时 ,需要 手工 添加 Open() 方 法 以 打开 数据 库 的 连接 ,最 后 还 需 


要 添加 Close() 方 法 关闭 连接 。 


数据 库 的 访问 定义 在 数据 访问 类 Classl 中 ,部 分 源 程序 代码 如 下 。 


public DataSet comboxtext () 

{ 
string constr ="Data Source=127.0.0.1;Initial 

Catalog=HotelRoomDB;Integrated Security=True"; 

SqlConnection con =new SqlConnection(constr); 
con.Open () 7 
string sqlstr ="select * from Room "7 
SqlCommand cmd =new SqlCommand (); 
cmd.Connection =con; 
cmd.CommandText =sqlstr; 
SqlDataAdapter da =new SqlDataAdapter (cmd); 
DataSet ds =new DataSet (); 
da.Fill (ds); 
da.Dispose(); 
con.Close(); 


return ds; 


15.5 系统 界面 设计 及 相关 代码 实现 


15.5.1 酒店 客房 管理 系统 的 首 界面 设计 及 其 代码 实现 


284 


当 用 户 进入 酒店 客房 管理 系统 首 界面 后 ,需要 输入 用 户 名 、 密 码 和 用 户 类 型 (酒店 管 
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理 员 或 前 台 服 务 员 ) 进 行 身份 验证 ,系统 在 验证 通过 后 ,进入 酒店 客房 管理 系统 的 主 界面 ， 
并 根据 用 户 类 型 确定 用 户 的 使 用 权限 。 酒 店 客房 管理 系统 的 首 界面 如 图 15. 7 所 示 , 它 是 
由 系统 主 窗口 和 登录 窗口 构成 的 。 


本 酒店 客房 管理 系统 回回 加 


图 15.7 酒店 客房 管理 系统 首 界面 


登录 窗口 的 部 分 源 代码 如 下 所 示 。 


private void Login Click (object sender, EventArgs e) 
{ 
string sqlcon ="select pw from student where userno='"+textBoxl.Text+""'"; 
Classl cl =new Class1(); 
DataSet ds =new DataSet (); 
ds =cl.Dbselect (sqlcon); 
string str =ds.Tables [0] .Rows [0] [0] .Tostring(); 
if (textBox2.Text ==str) 
{ 
Form2 f2 =new Form2(); 
this.Hide(); 


主 窗口 .ShowDialog (); 


this.Close() 7 


else 


MessageBox .Show ("" 登 录 失 败 ! 请 输入 正确 信息 重新 登录 !"") 7 
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15.5.2 客房 信息 管理 界面 的 设计 及 其 代码 实现 


客房 信息 管理 是 系统 的 主要 部 分 ,主要 负责 对 所 有 客房 信息 的 维护 , 即 增 加 、 删 除 和 


修改 。“ 客 房 信 息 管理 ”窗口 如 图 15. 8 所 示 。 


蛋 客房 信息 管理 


南 一 楼 一 层 西边 


普通 标准 间 ,环境 好 适 ， 面 马路 


| 普通 标准 间 ， 
豪华 套房 ， 环 
南 一 楼 一 层 西 边 .，| 普 通 标准 间 ，.. -图 | 
NT | 国 | 


图 15.8 “客房 信息 管理 "窗口 


数据 更 新 是 指 对 数据 进行 添加 、 删 除 和 修改 等 操作 。 利 用 Command 对 象 进行 更 新 


数据 源 的 一 般 过 程 如 下 。 
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(1) 设置 参数 连接 Connection, 并 打开 此 连接 ; 

(2) 定义 一 个 Command 对 象 ,并 设置 其 参数 ; 

(3) 用 SQL 语句 设置 CommandText 属性 ,或 者 使 用 临时 参数 赋值 的 方法 进行 更 新 ; 
(4) 通过 调用 ExecuteNonQuery 方法 ,来 更 新 数据 源 ; 

(5) 关闭 数据 连接 。 

“客房 信息 管理 窗口 的 部 分 源 代码 如 下 所 示 。 


// 实 现 * 修 改 " 按 钮 的 单 击 事件 
private void update Click(object sender, EventArgs e) 
和 

string constr = "Data Source= 127. 0.0. 1; Initial Catalog= HotelRoomDB; 
Integrated Security=True"; 

SqlConnection con =new SqlConnection(constr); 

con.Open () 7 

string sqlstr ="update Room set roomTYPe= '"”+ComboBoxl.Text.ToString () + 
"',position='"+textBox2. Text.ToString ()+"',description='"+textBox3. Text. 
Tostring()+"' where roomNo='"+textBoxl.Text.Tostring ()+""'"; 

SqlCommand cmd =new SqlCommand (); 

cmd.Connection =con; 


cmd.CommandText =sqlstr; 
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int r=cmd.ExecuteNonQuery (); 
if (r==0) 
{ 
MessageBox.Show ("更 新 失败 !"); 
} 
elae 
{ 
MessageBox.Show ("更 新 成 功 !"); 
textBoxl.Text =""; 


ComboBoxl1.Text 
textBox2.Text 
textBox3.Text =""; 
t 
con.Close (); 


} 


由 于 篇 幅 有 限 , 关 于 客房 类 型 管理 .用 户 管理 ,信息 查询 等 界面 的 设计 和 相关 代码 的 
实现 ,读者 可 参考 上 面 的 界面 自己 完成 。 


小 结 


本 章 以 Visual Studio 2008 为 开发 环境 ,使 用 CH# 语 言 作为 开发 工具 ,以 酒店 客房 管 
理 系统 为 例 , 介 绍 了 数据 库 应 用 系统 的 开发 方法 。 
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